chore: run formatting

2025-12-12 04:15:25 +00:00 · 2025-07-22 22:46:00 -06:00 · 2025-07-22 22:46:00 -06:00 · 860f3b3cab
commit 860f3b3cab
parent 8dcf668448
2 changed files with 287 additions and 205 deletions
--- a/backend/open_webui/retrieval/vector/dbs/s3vector.py
+++ b/backend/open_webui/retrieval/vector/dbs/s3vector.py
@ -1,4 +1,9 @@
-from open_webui.retrieval.vector.main import VectorDBBase, VectorItem, GetResult, SearchResult
+from open_webui.retrieval.vector.main import (
+    VectorDBBase,
+    VectorItem,
+    GetResult,
+    SearchResult,
+)
 from open_webui.config import S3_VECTOR_BUCKET_NAME, S3_VECTOR_REGION
 from open_webui.env import SRC_LOG_LEVELS
 from typing import List, Optional, Dict, Any, Union
@ -8,6 +13,7 @@ import boto3
 log = logging.getLogger(__name__)
 log.setLevel(SRC_LOG_LEVELS["RAG"])

+
 class S3VectorClient(VectorDBBase):
    """
    AWS S3 Vector integration for Open WebUI Knowledge.
@ -26,14 +32,22 @@ class S3VectorClient(VectorDBBase):
        if self.bucket_name and self.region:
            try:
                self.client = boto3.client("s3vectors", region_name=self.region)
-                log.info(f"S3Vector client initialized for bucket '{self.bucket_name}' in region '{self.region}'")
+                log.info(
+                    f"S3Vector client initialized for bucket '{self.bucket_name}' in region '{self.region}'"
+                )
            except Exception as e:
                log.error(f"Failed to initialize S3Vector client: {e}")
                self.client = None
        else:
            self.client = None

-    def _create_index(self, index_name: str, dimension: int, data_type: str = "float32", distance_metric: str = "cosine") -> None:
+    def _create_index(
+        self,
+        index_name: str,
+        dimension: int,
+        data_type: str = "float32",
+        distance_metric: str = "cosine",
+    ) -> None:
        """
        Create a new index in the S3 vector bucket for the given collection if it does not exist.
        """
@ -49,12 +63,16 @@ class S3VectorClient(VectorDBBase):
                dimension=dimension,
                distanceMetric=distance_metric,
            )
-            log.info(f"Created S3 index: {index_name} (dim={dimension}, type={data_type}, metric={distance_metric})")
+            log.info(
+                f"Created S3 index: {index_name} (dim={dimension}, type={data_type}, metric={distance_metric})"
+            )
        except Exception as e:
            log.error(f"Error creating S3 index '{index_name}': {e}")
            raise

-    def _filter_metadata(self, metadata: Dict[str, Any], item_id: str) -> Dict[str, Any]:
+    def _filter_metadata(
+        self, metadata: Dict[str, Any], item_id: str
+    ) -> Dict[str, Any]:
        """
        Filter vector metadata keys to comply with S3 Vector API limit of 10 keys maximum.
        """
@ -63,16 +81,16 @@ class S3VectorClient(VectorDBBase):

        # Keep only the first 10 keys, prioritizing important ones based on actual Open WebUI metadata
        important_keys = [
-            'text',             # The actual document content
-            'file_id',          # File ID
-            'source',           # Document source file
-            'title',            # Document title
-            'page',             # Page number
-            'total_pages',      # Total pages in document
-            'embedding_config', # Embedding configuration
-            'created_by',       # User who created it
-            'name',             # Document name
-            'hash',             # Content hash
+            "text",  # The actual document content
+            "file_id",  # File ID
+            "source",  # Document source file
+            "title",  # Document title
+            "page",  # Page number
+            "total_pages",  # Total pages in document
+            "embedding_config",  # Embedding configuration
+            "created_by",  # User who created it
+            "name",  # Document name
+            "hash",  # Content hash
        ]
        filtered_metadata = {}

@ -91,7 +109,9 @@ class S3VectorClient(VectorDBBase):
                    if len(filtered_metadata) >= 10:
                        break

-        log.warning(f"Metadata for key '{item_id}' had {len(metadata)} keys, limited to 10 keys")
+        log.warning(
+            f"Metadata for key '{item_id}' had {len(metadata)} keys, limited to 10 keys"
+        )
        return filtered_metadata

    def has_collection(self, collection_name: str) -> bool:
@ -113,14 +133,15 @@ class S3VectorClient(VectorDBBase):
        """

        if not self.has_collection(collection_name):
-            log.warning(f"Collection '{collection_name}' does not exist, nothing to delete")
+            log.warning(
+                f"Collection '{collection_name}' does not exist, nothing to delete"
+            )
            return

        try:
            log.info(f"Deleting collection '{collection_name}'")
            self.client.delete_index(
-                vectorBucketName=self.bucket_name,
-                indexName=collection_name
+                vectorBucketName=self.bucket_name, indexName=collection_name
            )
            log.info(f"Successfully deleted collection '{collection_name}'")
        except Exception as e:
@ -165,18 +186,18 @@ class S3VectorClient(VectorDBBase):
                # Filter metadata to comply with S3 Vector API limit of 10 keys
                metadata = self._filter_metadata(metadata, item["id"])

-                vectors.append({
+                vectors.append(
+                    {
                        "key": item["id"],
-                    "data": {
-                        "float32": vector_data
-                    },
-                    "metadata": metadata
-                })
+                        "data": {"float32": vector_data},
+                        "metadata": metadata,
+                    }
+                )
            # Insert vectors
            self.client.put_vectors(
                vectorBucketName=self.bucket_name,
                indexName=collection_name,
-                vectors=vectors
+                vectors=vectors,
            )
            log.info(f"Inserted {len(vectors)} vectors into index '{collection_name}'.")
        except Exception as e:
@ -196,7 +217,9 @@ class S3VectorClient(VectorDBBase):

        try:
            if not self.has_collection(collection_name):
-                log.info(f"Index '{collection_name}' does not exist. Creating index for upsert.")
+                log.info(
+                    f"Index '{collection_name}' does not exist. Creating index for upsert."
+                )
                self._create_index(
                    index_name=collection_name,
                    dimension=dimension,
@ -221,26 +244,30 @@ class S3VectorClient(VectorDBBase):
                # Filter metadata to comply with S3 Vector API limit of 10 keys
                metadata = self._filter_metadata(metadata, item["id"])

-                vectors.append({
+                vectors.append(
+                    {
                        "key": item["id"],
-                    "data": {
-                        "float32": vector_data
-                    },
-                    "metadata": metadata
-                })
+                        "data": {"float32": vector_data},
+                        "metadata": metadata,
+                    }
+                )
            # Upsert vectors (using put_vectors for upsert semantics)
-            log.info(f"Upserting {len(vectors)} vectors. First vector sample: key={vectors[0]['key']}, data_type={type(vectors[0]['data']['float32'])}, data_len={len(vectors[0]['data']['float32'])}")
+            log.info(
+                f"Upserting {len(vectors)} vectors. First vector sample: key={vectors[0]['key']}, data_type={type(vectors[0]['data']['float32'])}, data_len={len(vectors[0]['data']['float32'])}"
+            )
            self.client.put_vectors(
                vectorBucketName=self.bucket_name,
                indexName=collection_name,
-                vectors=vectors
+                vectors=vectors,
            )
            log.info(f"Upserted {len(vectors)} vectors into index '{collection_name}'.")
        except Exception as e:
            log.error(f"Error upserting vectors: {e}")
            raise

-    def search(self, collection_name: str, vectors: List[List[Union[float, int]]], limit: int) -> Optional[SearchResult]:
+    def search(
+        self, collection_name: str, vectors: List[List[Union[float, int]]], limit: int
+    ) -> Optional[SearchResult]:
        """
        Search for similar vectors in a collection using multiple query vectors.
        """
@ -254,7 +281,9 @@ class S3VectorClient(VectorDBBase):
            return None

        try:
-            log.info(f"Searching collection '{collection_name}' with {len(vectors)} query vectors, limit={limit}")
+            log.info(
+                f"Searching collection '{collection_name}' with {len(vectors)} query vectors, limit={limit}"
+            )

            # Initialize result lists
            all_ids = []
@ -267,9 +296,7 @@ class S3VectorClient(VectorDBBase):
                log.debug(f"Processing query vector {i+1}/{len(vectors)}")

                # Prepare the query vector in S3 Vector format
-                query_vector_dict = {
-                    'float32': [float(x) for x in query_vector]
-                }
+                query_vector_dict = {"float32": [float(x) for x in query_vector]}

                # Call S3 Vector query API
                response = self.client.query_vectors(
@ -278,7 +305,7 @@ class S3VectorClient(VectorDBBase):
                    topK=limit,
                    queryVector=query_vector_dict,
                    returnMetadata=True,
-                    returnDistance=True
+                    returnDistance=True,
                )

                # Process results for this query
@ -287,23 +314,25 @@ class S3VectorClient(VectorDBBase):
                query_metadatas = []
                query_distances = []

-                result_vectors = response.get('vectors', [])
+                result_vectors = response.get("vectors", [])

                for vector in result_vectors:
-                    vector_id = vector.get('key')
-                    vector_metadata = vector.get('metadata', {})
-                    vector_distance = vector.get('distance', 0.0)
+                    vector_id = vector.get("key")
+                    vector_metadata = vector.get("metadata", {})
+                    vector_distance = vector.get("distance", 0.0)

                    # Extract document text from metadata
                    document_text = ""
                    if isinstance(vector_metadata, dict):
                        # Get the text field first (highest priority)
-                        document_text = vector_metadata.get('text')
+                        document_text = vector_metadata.get("text")
                        if not document_text:
                            # Fallback to other possible text fields
-                            document_text = (vector_metadata.get('content') or 
-                                           vector_metadata.get('document') or 
-                                           vector_id)
+                            document_text = (
+                                vector_metadata.get("content")
+                                or vector_metadata.get("document")
+                                or vector_id
+                            )
                    else:
                        document_text = vector_id

@ -325,26 +354,30 @@ class S3VectorClient(VectorDBBase):
                ids=all_ids if all_ids else None,
                documents=all_documents if all_documents else None,
                metadatas=all_metadatas if all_metadatas else None,
-                distances=all_distances if all_distances else None
+                distances=all_distances if all_distances else None,
            )

        except Exception as e:
            log.error(f"Error searching collection '{collection_name}': {str(e)}")
            # Handle specific AWS exceptions
-            if hasattr(e, 'response') and 'Error' in e.response:
-                error_code = e.response['Error']['Code']
-                if error_code == 'NotFoundException':
+            if hasattr(e, "response") and "Error" in e.response:
+                error_code = e.response["Error"]["Code"]
+                if error_code == "NotFoundException":
                    log.warning(f"Collection '{collection_name}' not found")
                    return None
-                elif error_code == 'ValidationException':
+                elif error_code == "ValidationException":
                    log.error(f"Invalid query vector dimensions or parameters")
                    return None
-                elif error_code == 'AccessDeniedException':
-                    log.error(f"Access denied for collection '{collection_name}'. Check permissions.")
+                elif error_code == "AccessDeniedException":
+                    log.error(
+                        f"Access denied for collection '{collection_name}'. Check permissions."
+                    )
                    return None
            raise

-    def query(self, collection_name: str, filter: Dict, limit: Optional[int] = None) -> Optional[GetResult]:
+    def query(
+        self, collection_name: str, filter: Dict, limit: Optional[int] = None
+    ) -> Optional[GetResult]:
        """
        Query vectors from a collection using metadata filter.
        """
@ -373,8 +406,12 @@ class S3VectorClient(VectorDBBase):

            # Extract the lists from the result
            all_ids = all_vectors_result.ids[0] if all_vectors_result.ids else []
-            all_documents = all_vectors_result.documents[0] if all_vectors_result.documents else []
-            all_metadatas = all_vectors_result.metadatas[0] if all_vectors_result.metadatas else []
+            all_documents = (
+                all_vectors_result.documents[0] if all_vectors_result.documents else []
+            )
+            all_metadatas = (
+                all_vectors_result.metadatas[0] if all_vectors_result.metadatas else []
+            )

            # Apply client-side filtering
            filtered_ids = []
@ -393,24 +430,32 @@ class S3VectorClient(VectorDBBase):
                    if limit and len(filtered_ids) >= limit:
                        break

-            log.info(f"Filter applied: {len(filtered_ids)} vectors match out of {len(all_ids)} total")
+            log.info(
+                f"Filter applied: {len(filtered_ids)} vectors match out of {len(all_ids)} total"
+            )

            # Return GetResult format
            if filtered_ids:
-                return GetResult(ids=[filtered_ids], documents=[filtered_documents], metadatas=[filtered_metadatas])
+                return GetResult(
+                    ids=[filtered_ids],
+                    documents=[filtered_documents],
+                    metadatas=[filtered_metadatas],
+                )
            else:
                return GetResult(ids=[[]], documents=[[]], metadatas=[[]])

        except Exception as e:
            log.error(f"Error querying collection '{collection_name}': {str(e)}")
            # Handle specific AWS exceptions
-            if hasattr(e, 'response') and 'Error' in e.response:
-                error_code = e.response['Error']['Code']
-                if error_code == 'NotFoundException':
+            if hasattr(e, "response") and "Error" in e.response:
+                error_code = e.response["Error"]["Code"]
+                if error_code == "NotFoundException":
                    log.warning(f"Collection '{collection_name}' not found")
                    return GetResult(ids=[[]], documents=[[]], metadatas=[[]])
-                elif error_code == 'AccessDeniedException':
-                    log.error(f"Access denied for collection '{collection_name}'. Check permissions.")
+                elif error_code == "AccessDeniedException":
+                    log.error(
+                        f"Access denied for collection '{collection_name}'. Check permissions."
+                    )
                    return GetResult(ids=[[]], documents=[[]], metadatas=[[]])
            raise

@ -437,43 +482,47 @@ class S3VectorClient(VectorDBBase):
            while True:
                # Prepare request parameters
                request_params = {
-                    'vectorBucketName': self.bucket_name,
-                    'indexName': collection_name,
-                    'returnData': False,  # Don't include vector data (not needed for get)
-                    'returnMetadata': True,  # Include metadata
-                    'maxResults': 500  # Use reasonable page size
+                    "vectorBucketName": self.bucket_name,
+                    "indexName": collection_name,
+                    "returnData": False,  # Don't include vector data (not needed for get)
+                    "returnMetadata": True,  # Include metadata
+                    "maxResults": 500,  # Use reasonable page size
                }

                if next_token:
-                    request_params['nextToken'] = next_token
+                    request_params["nextToken"] = next_token

                # Call S3 Vector API
                response = self.client.list_vectors(**request_params)

                # Process vectors in this page
-                vectors = response.get('vectors', [])
+                vectors = response.get("vectors", [])

                for vector in vectors:
-                    vector_id = vector.get('key')
-                    vector_data = vector.get('data', {})
-                    vector_metadata = vector.get('metadata', {})
+                    vector_id = vector.get("key")
+                    vector_data = vector.get("data", {})
+                    vector_metadata = vector.get("metadata", {})

                    # Extract the actual vector array
-                    vector_array = vector_data.get('float32', [])
+                    vector_array = vector_data.get("float32", [])

                    # For documents, we try to extract text from metadata or use the vector ID
                    document_text = ""
                    if isinstance(vector_metadata, dict):
                        # Get the text field first (highest priority)
-                        document_text = vector_metadata.get('text')
+                        document_text = vector_metadata.get("text")
                        if not document_text:
                            # Fallback to other possible text fields
-                            document_text = (vector_metadata.get('content') or 
-                                           vector_metadata.get('document') or 
-                                           vector_id)
+                            document_text = (
+                                vector_metadata.get("content")
+                                or vector_metadata.get("document")
+                                or vector_id
+                            )

                        # Log the actual content for debugging
-                        log.debug(f"Document text preview (first 200 chars): {str(document_text)[:200]}")
+                        log.debug(
+                            f"Document text preview (first 200 chars): {str(document_text)[:200]}"
+                        )
                    else:
                        document_text = vector_id

@ -482,39 +531,54 @@ class S3VectorClient(VectorDBBase):
                    all_metadatas.append(vector_metadata)

                # Check if there are more pages
-                next_token = response.get('nextToken')
+                next_token = response.get("nextToken")
                if not next_token:
                    break

-            log.info(f"Retrieved {len(all_ids)} vectors from collection '{collection_name}'")
+            log.info(
+                f"Retrieved {len(all_ids)} vectors from collection '{collection_name}'"
+            )

            # Return in GetResult format
            # The Open WebUI GetResult expects lists of lists, so we wrap each list
            if all_ids:
-                return GetResult(ids=[all_ids], documents=[all_documents], metadatas=[all_metadatas])
+                return GetResult(
+                    ids=[all_ids], documents=[all_documents], metadatas=[all_metadatas]
+                )
            else:
                return GetResult(ids=[[]], documents=[[]], metadatas=[[]])

        except Exception as e:
-            log.error(f"Error retrieving vectors from collection '{collection_name}': {str(e)}")
+            log.error(
+                f"Error retrieving vectors from collection '{collection_name}': {str(e)}"
+            )
            # Handle specific AWS exceptions
-            if hasattr(e, 'response') and 'Error' in e.response:
-                error_code = e.response['Error']['Code']
-                if error_code == 'NotFoundException':
+            if hasattr(e, "response") and "Error" in e.response:
+                error_code = e.response["Error"]["Code"]
+                if error_code == "NotFoundException":
                    log.warning(f"Collection '{collection_name}' not found")
                    return GetResult(ids=[[]], documents=[[]], metadatas=[[]])
-                elif error_code == 'AccessDeniedException':
-                    log.error(f"Access denied for collection '{collection_name}'. Check permissions.")
+                elif error_code == "AccessDeniedException":
+                    log.error(
+                        f"Access denied for collection '{collection_name}'. Check permissions."
+                    )
                    return GetResult(ids=[[]], documents=[[]], metadatas=[[]])
            raise

-    def delete(self, collection_name: str, ids: Optional[List[str]] = None, filter: Optional[Dict] = None) -> None:
+    def delete(
+        self,
+        collection_name: str,
+        ids: Optional[List[str]] = None,
+        filter: Optional[Dict] = None,
+    ) -> None:
        """
        Delete vectors by ID or filter from a collection.
        """

        if not self.has_collection(collection_name):
-            log.warning(f"Collection '{collection_name}' does not exist, nothing to delete")
+            log.warning(
+                f"Collection '{collection_name}' does not exist, nothing to delete"
+            )
            return

        # Check if this is a knowledge collection (not file-specific)
@ -523,17 +587,21 @@ class S3VectorClient(VectorDBBase):
        try:
            if ids:
                # Delete by specific vector IDs/keys
-                log.info(f"Deleting {len(ids)} vectors by IDs from collection '{collection_name}'")
+                log.info(
+                    f"Deleting {len(ids)} vectors by IDs from collection '{collection_name}'"
+                )
                self.client.delete_vectors(
                    vectorBucketName=self.bucket_name,
                    indexName=collection_name,
-                    keys=ids
+                    keys=ids,
                )
                log.info(f"Deleted {len(ids)} vectors from index '{collection_name}'")

            elif filter:
                # Handle filter-based deletion
-                log.info(f"Deleting vectors by filter from collection '{collection_name}': {filter}")
+                log.info(
+                    f"Deleting vectors by filter from collection '{collection_name}': {filter}"
+                )

                # If this is a knowledge collection and we have a file_id filter,
                # also clean up the corresponding file-specific collection
@ -541,7 +609,9 @@ class S3VectorClient(VectorDBBase):
                    file_id = filter["file_id"]
                    file_collection_name = f"file-{file_id}"
                    if self.has_collection(file_collection_name):
-                        log.info(f"Found related file-specific collection '{file_collection_name}', deleting it to prevent duplicates")
+                        log.info(
+                            f"Found related file-specific collection '{file_collection_name}', deleting it to prevent duplicates"
+                        )
                        self.delete_collection(file_collection_name)

                # For the main collection, implement query-then-delete
@ -549,21 +619,27 @@ class S3VectorClient(VectorDBBase):
                query_result = self.query(collection_name, filter)
                if query_result and query_result.ids and query_result.ids[0]:
                    matching_ids = query_result.ids[0]
-                    log.info(f"Found {len(matching_ids)} vectors matching filter, deleting them")
+                    log.info(
+                        f"Found {len(matching_ids)} vectors matching filter, deleting them"
+                    )

                    # Delete the matching vectors by ID
                    self.client.delete_vectors(
                        vectorBucketName=self.bucket_name,
                        indexName=collection_name,
-                        keys=matching_ids
+                        keys=matching_ids,
+                    )
+                    log.info(
+                        f"Deleted {len(matching_ids)} vectors from index '{collection_name}' using filter"
                    )
-                    log.info(f"Deleted {len(matching_ids)} vectors from index '{collection_name}' using filter")
                else:
                    log.warning("No vectors found matching the filter criteria")
            else:
                log.warning("No IDs or filter provided for deletion")
        except Exception as e:
-            log.error(f"Error deleting vectors from collection '{collection_name}': {e}")
+            log.error(
+                f"Error deleting vectors from collection '{collection_name}': {e}"
+            )
            raise

    def reset(self) -> None:
@ -572,7 +648,9 @@ class S3VectorClient(VectorDBBase):
        """

        try:
-            log.warning("Reset called - this will delete all vector indexes in the S3 bucket")
+            log.warning(
+                "Reset called - this will delete all vector indexes in the S3 bucket"
+            )

            # List all indexes
            response = self.client.list_indexes(vectorBucketName=self.bucket_name)
@ -589,8 +667,7 @@ class S3VectorClient(VectorDBBase):
                if index_name:
                    try:
                        self.client.delete_index(
-                            vectorBucketName=self.bucket_name,
-                            indexName=index_name
+                            vectorBucketName=self.bucket_name, indexName=index_name
                        )
                        deleted_count += 1
                        log.info(f"Deleted index: {index_name}")
@ -613,15 +690,15 @@ class S3VectorClient(VectorDBBase):
        # Check each filter condition
        for key, expected_value in filter.items():
            # Handle special operators
-            if key.startswith('$'):
-                if key == '$and':
+            if key.startswith("$"):
+                if key == "$and":
                    # All conditions must match
                    if not isinstance(expected_value, list):
                        continue
                    for condition in expected_value:
                        if not self._matches_filter(metadata, condition):
                            return False
-                elif key == '$or':
+                elif key == "$or":
                    # At least one condition must match
                    if not isinstance(expected_value, list):
                        continue
@ -641,19 +718,22 @@ class S3VectorClient(VectorDBBase):
            if isinstance(expected_value, dict):
                # Handle comparison operators
                for op, op_value in expected_value.items():
-                    if op == '$eq':
+                    if op == "$eq":
                        if actual_value != op_value:
                            return False
-                    elif op == '$ne':
+                    elif op == "$ne":
                        if actual_value == op_value:
                            return False
-                    elif op == '$in':
-                        if not isinstance(op_value, list) or actual_value not in op_value:
+                    elif op == "$in":
+                        if (
+                            not isinstance(op_value, list)
+                            or actual_value not in op_value
+                        ):
                            return False
-                    elif op == '$nin':
+                    elif op == "$nin":
                        if isinstance(op_value, list) and actual_value in op_value:
                            return False
-                    elif op == '$exists':
+                    elif op == "$exists":
                        if bool(op_value) != (key in metadata):
                            return False
                    # Add more operators as needed
--- a/backend/open_webui/retrieval/vector/factory.py
+++ b/backend/open_webui/retrieval/vector/factory.py
@ -28,9 +28,11 @@ class Vector:
                    return QdrantClient()
            case VectorType.PINECONE:
                from open_webui.retrieval.vector.dbs.pinecone import PineconeClient
+
                return PineconeClient()
            case VectorType.S3VECTOR:
                from open_webui.retrieval.vector.dbs.s3vector import S3VectorClient
+
                return S3VectorClient()
            case VectorType.OPENSEARCH:
                from open_webui.retrieval.vector.dbs.opensearch import OpenSearchClient