From 362bdebd026a7d65c2d4c2fcddca54939a103f64 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Mon, 4 Nov 2024 16:37:13 -0800
Subject: [PATCH 01/42] Add methods for reading full files by name and
 including context

Now that models have much larger context windows, we can reasonably include full texts of certain files in the messages. Do this when an explicit file filter is set in a conversation. Do so in a separate user message in order to mitigate any confusion in the operation.

Pipe the relevant attached_files context through all methods calling into models.

We'll want to limit the file sizes for which this is used and provide more helpful UI indicators that this sort of behavior is taking place.
---
 src/khoj/database/adapters/__init__.py        |  4 +
 .../conversation/anthropic/anthropic_chat.py  |  2 +
 .../conversation/google/gemini_chat.py        | 11 ++-
 .../conversation/offline/chat_model.py        |  4 +
 src/khoj/processor/conversation/openai/gpt.py |  2 +
 src/khoj/processor/conversation/utils.py      |  8 ++
 src/khoj/processor/image/generate.py          |  2 +
 src/khoj/processor/tools/online_search.py     | 20 ++++-
 src/khoj/processor/tools/run_code.py          |  5 ++
 src/khoj/routers/api_chat.py                  | 14 +++-
 src/khoj/routers/helpers.py                   | 76 +++++++++++++++++--
 src/khoj/routers/research.py                  |  7 ++
 12 files changed, 142 insertions(+), 13 deletions(-)

diff --git a/src/khoj/database/adapters/__init__.py b/src/khoj/database/adapters/__init__.py
index 164b4023..1c8336a3 100644
--- a/src/khoj/database/adapters/__init__.py
+++ b/src/khoj/database/adapters/__init__.py
@@ -1387,6 +1387,10 @@ class FileObjectAdapters:
     async def async_get_file_objects_by_name(user: KhojUser, file_name: str, agent: Agent = None):
         return await sync_to_async(list)(FileObject.objects.filter(user=user, file_name=file_name, agent=agent))
 
+    @staticmethod
+    async def async_get_file_objects_by_names(user: KhojUser, file_names: List[str]):
+        return await sync_to_async(list)(FileObject.objects.filter(user=user, file_name__in=file_names))
+
     @staticmethod
     async def async_get_all_file_objects(user: KhojUser):
         return await sync_to_async(list)(FileObject.objects.filter(user=user))
diff --git a/src/khoj/processor/conversation/anthropic/anthropic_chat.py b/src/khoj/processor/conversation/anthropic/anthropic_chat.py
index e2fd0c74..df81f56f 100644
--- a/src/khoj/processor/conversation/anthropic/anthropic_chat.py
+++ b/src/khoj/processor/conversation/anthropic/anthropic_chat.py
@@ -147,6 +147,7 @@ def converse_anthropic(
     query_images: Optional[list[str]] = None,
     vision_available: bool = False,
     tracer: dict = {},
+    attached_files: str = None,
 ):
     """
     Converse with user using Anthropic's Claude
@@ -203,6 +204,7 @@ def converse_anthropic(
         query_images=query_images,
         vision_enabled=vision_available,
         model_type=ChatModelOptions.ModelType.ANTHROPIC,
+        attached_files=attached_files,
     )
 
     messages, system_prompt = format_messages_for_anthropic(messages, system_prompt)
diff --git a/src/khoj/processor/conversation/google/gemini_chat.py b/src/khoj/processor/conversation/google/gemini_chat.py
index aebda1a8..b7ec018d 100644
--- a/src/khoj/processor/conversation/google/gemini_chat.py
+++ b/src/khoj/processor/conversation/google/gemini_chat.py
@@ -108,7 +108,14 @@ def extract_questions_gemini(
 
 
 def gemini_send_message_to_model(
-    messages, api_key, model, response_type="text", temperature=0, model_kwargs=None, tracer={}
+    messages,
+    api_key,
+    model,
+    response_type="text",
+    temperature=0,
+    model_kwargs=None,
+    tracer={},
+    attached_files: str = None,
 ):
     """
     Send message to model
@@ -152,6 +159,7 @@ def converse_gemini(
     query_images: Optional[list[str]] = None,
     vision_available: bool = False,
     tracer={},
+    attached_files: str = None,
 ):
     """
     Converse with user using Google's Gemini
@@ -209,6 +217,7 @@ def converse_gemini(
         query_images=query_images,
         vision_enabled=vision_available,
         model_type=ChatModelOptions.ModelType.GOOGLE,
+        attached_files=attached_files,
     )
 
     messages, system_prompt = format_messages_for_gemini(messages, system_prompt)
diff --git a/src/khoj/processor/conversation/offline/chat_model.py b/src/khoj/processor/conversation/offline/chat_model.py
index aaaaa081..d0b62f3d 100644
--- a/src/khoj/processor/conversation/offline/chat_model.py
+++ b/src/khoj/processor/conversation/offline/chat_model.py
@@ -38,6 +38,7 @@ def extract_questions_offline(
     temperature: float = 0.7,
     personality_context: Optional[str] = None,
     tracer: dict = {},
+    attached_files: str = None,
 ) -> List[str]:
     """
     Infer search queries to retrieve relevant notes to answer user query
@@ -87,6 +88,7 @@ def extract_questions_offline(
         loaded_model=offline_chat_model,
         max_prompt_size=max_prompt_size,
         model_type=ChatModelOptions.ModelType.OFFLINE,
+        attached_files=attached_files,
     )
 
     state.chat_lock.acquire()
@@ -153,6 +155,7 @@ def converse_offline(
     user_name: str = None,
     agent: Agent = None,
     tracer: dict = {},
+    attached_files: str = None,
 ) -> Union[ThreadedGenerator, Iterator[str]]:
     """
     Converse with user using Llama
@@ -216,6 +219,7 @@ def converse_offline(
         max_prompt_size=max_prompt_size,
         tokenizer_name=tokenizer_name,
         model_type=ChatModelOptions.ModelType.OFFLINE,
+        attached_files=attached_files,
     )
 
     truncated_messages = "\n".join({f"{message.content[:70]}..." for message in messages})
diff --git a/src/khoj/processor/conversation/openai/gpt.py b/src/khoj/processor/conversation/openai/gpt.py
index c376a90e..bdb67448 100644
--- a/src/khoj/processor/conversation/openai/gpt.py
+++ b/src/khoj/processor/conversation/openai/gpt.py
@@ -149,6 +149,7 @@ def converse(
     query_images: Optional[list[str]] = None,
     vision_available: bool = False,
     tracer: dict = {},
+    attached_files: str = None,
 ):
     """
     Converse with user using OpenAI's ChatGPT
@@ -206,6 +207,7 @@ def converse(
         query_images=query_images,
         vision_enabled=vision_available,
         model_type=ChatModelOptions.ModelType.OPENAI,
+        attached_files=attached_files,
     )
     truncated_messages = "\n".join({f"{message.content[:70]}..." for message in messages})
     logger.debug(f"Conversation Context for GPT: {truncated_messages}")
diff --git a/src/khoj/processor/conversation/utils.py b/src/khoj/processor/conversation/utils.py
index 74c464d9..b510a09a 100644
--- a/src/khoj/processor/conversation/utils.py
+++ b/src/khoj/processor/conversation/utils.py
@@ -318,6 +318,7 @@ def generate_chatml_messages_with_context(
     vision_enabled=False,
     model_type="",
     context_message="",
+    attached_files: str = None,
 ):
     """Generate chat messages with appropriate context from previous conversation to send to the chat model"""
     # Set max prompt size from user config or based on pre-configured for model and machine specs
@@ -341,8 +342,10 @@ def generate_chatml_messages_with_context(
                 {f"# File: {item['file']}\n## {item['compiled']}\n" for item in chat.get("context") or []}
             )
             message_context += f"{prompts.notes_conversation.format(references=references)}\n\n"
+
         if not is_none_or_empty(chat.get("onlineContext")):
             message_context += f"{prompts.online_search_conversation.format(online_results=chat.get('onlineContext'))}"
+
         if not is_none_or_empty(message_context):
             reconstructed_context_message = ChatMessage(content=message_context, role="user")
             chatml_messages.insert(0, reconstructed_context_message)
@@ -366,8 +369,13 @@ def generate_chatml_messages_with_context(
         )
     if not is_none_or_empty(context_message):
         messages.append(ChatMessage(content=context_message, role="user"))
+
+    if not is_none_or_empty(attached_files):
+        messages.append(ChatMessage(content=attached_files, role="user"))
+
     if len(chatml_messages) > 0:
         messages += chatml_messages
+
     if not is_none_or_empty(system_message):
         messages.append(ChatMessage(content=system_message, role="system"))
 
diff --git a/src/khoj/processor/image/generate.py b/src/khoj/processor/image/generate.py
index bdc00e09..ec5254ec 100644
--- a/src/khoj/processor/image/generate.py
+++ b/src/khoj/processor/image/generate.py
@@ -29,6 +29,7 @@ async def text_to_image(
     query_images: Optional[List[str]] = None,
     agent: Agent = None,
     tracer: dict = {},
+    attached_files: str = None,
 ):
     status_code = 200
     image = None
@@ -70,6 +71,7 @@ async def text_to_image(
         user=user,
         agent=agent,
         tracer=tracer,
+        attached_files=attached_files,
     )
 
     if send_status_func:
diff --git a/src/khoj/processor/tools/online_search.py b/src/khoj/processor/tools/online_search.py
index c6fc7c20..3b4bd16a 100644
--- a/src/khoj/processor/tools/online_search.py
+++ b/src/khoj/processor/tools/online_search.py
@@ -68,6 +68,7 @@ async def search_online(
     query_images: List[str] = None,
     agent: Agent = None,
     tracer: dict = {},
+    attached_files: str = None,
 ):
     query += " ".join(custom_filters)
     if not is_internet_connected():
@@ -77,7 +78,14 @@ async def search_online(
 
     # Breakdown the query into subqueries to get the correct answer
     subqueries = await generate_online_subqueries(
-        query, conversation_history, location, user, query_images=query_images, agent=agent, tracer=tracer
+        query,
+        conversation_history,
+        location,
+        user,
+        query_images=query_images,
+        agent=agent,
+        tracer=tracer,
+        attached_files=attached_files,
     )
     response_dict = {}
 
@@ -159,11 +167,19 @@ async def read_webpages(
     agent: Agent = None,
     tracer: dict = {},
     max_webpages_to_read: int = DEFAULT_MAX_WEBPAGES_TO_READ,
+    attached_files: str = None,
 ):
     "Infer web pages to read from the query and extract relevant information from them"
     logger.info(f"Inferring web pages to read")
     urls = await infer_webpage_urls(
-        query, conversation_history, location, user, query_images, agent=agent, tracer=tracer
+        query,
+        conversation_history,
+        location,
+        user,
+        query_images,
+        agent=agent,
+        tracer=tracer,
+        attached_files=attached_files,
     )
 
     # Get the top 10 web pages to read
diff --git a/src/khoj/processor/tools/run_code.py b/src/khoj/processor/tools/run_code.py
index d4ba9af1..86388aee 100644
--- a/src/khoj/processor/tools/run_code.py
+++ b/src/khoj/processor/tools/run_code.py
@@ -6,6 +6,7 @@ import os
 from typing import Any, Callable, List, Optional
 
 import aiohttp
+import requests
 
 from khoj.database.adapters import ais_user_subscribed
 from khoj.database.models import Agent, KhojUser
@@ -37,6 +38,7 @@ async def run_code(
     agent: Agent = None,
     sandbox_url: str = SANDBOX_URL,
     tracer: dict = {},
+    attached_files: str = None,
 ):
     # Generate Code
     if send_status_func:
@@ -53,6 +55,7 @@ async def run_code(
                 query_images,
                 agent,
                 tracer,
+                attached_files,
             )
     except Exception as e:
         raise ValueError(f"Failed to generate code for {query} with error: {e}")
@@ -82,6 +85,7 @@ async def generate_python_code(
     query_images: List[str] = None,
     agent: Agent = None,
     tracer: dict = {},
+    attached_files: str = None,
 ) -> List[str]:
     location = f"{location_data}" if location_data else "Unknown"
     username = prompts.user_name.format(name=user.get_full_name()) if user.get_full_name() else ""
@@ -109,6 +113,7 @@ async def generate_python_code(
         response_type="json_object",
         user=user,
         tracer=tracer,
+        attached_files=attached_files,
     )
 
     # Validate that the response is a non-empty, JSON-serializable list
diff --git a/src/khoj/routers/api_chat.py b/src/khoj/routers/api_chat.py
index a20982ea..bb561ca5 100644
--- a/src/khoj/routers/api_chat.py
+++ b/src/khoj/routers/api_chat.py
@@ -19,7 +19,6 @@ from khoj.database.adapters import (
     AgentAdapters,
     ConversationAdapters,
     EntryAdapters,
-    FileObjectAdapters,
     PublicConversationAdapters,
     aget_user_name,
 )
@@ -46,7 +45,7 @@ from khoj.routers.helpers import (
     aget_relevant_output_modes,
     construct_automation_created_message,
     create_automation,
-    extract_relevant_info,
+    gather_attached_files,
     generate_excalidraw_diagram,
     generate_summary_from_files,
     get_conversation_command,
@@ -707,6 +706,8 @@ async def chat(
         ## Extract Document References
         compiled_references: List[Any] = []
         inferred_queries: List[Any] = []
+        file_filters = conversation.file_filters if conversation and conversation.file_filters else []
+        attached_file_context = await gather_attached_files(user, file_filters)
 
         if conversation_commands == [ConversationCommand.Default] or is_automated_task:
             conversation_commands = await aget_relevant_information_sources(
@@ -717,6 +718,7 @@ async def chat(
                 query_images=uploaded_images,
                 agent=agent,
                 tracer=tracer,
+                attached_files=attached_file_context,
             )
 
             # If we're doing research, we don't want to do anything else
@@ -757,6 +759,7 @@ async def chat(
                 location=location,
                 file_filters=conversation.file_filters if conversation else [],
                 tracer=tracer,
+                attached_files=attached_file_context,
             ):
                 if isinstance(research_result, InformationCollectionIteration):
                     if research_result.summarizedResult:
@@ -812,6 +815,7 @@ async def chat(
                     agent=agent,
                     send_status_func=partial(send_event, ChatEvent.STATUS),
                     tracer=tracer,
+                    attached_files=attached_file_context,
                 ):
                     if isinstance(response, dict) and ChatEvent.STATUS in response:
                         yield response[ChatEvent.STATUS]
@@ -945,6 +949,7 @@ async def chat(
                     query_images=uploaded_images,
                     agent=agent,
                     tracer=tracer,
+                    attached_files=attached_file_context,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
                         yield result[ChatEvent.STATUS]
@@ -970,6 +975,7 @@ async def chat(
                     query_images=uploaded_images,
                     agent=agent,
                     tracer=tracer,
+                    attached_files=attached_file_context,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
                         yield result[ChatEvent.STATUS]
@@ -1010,6 +1016,7 @@ async def chat(
                     query_images=uploaded_images,
                     agent=agent,
                     tracer=tracer,
+                    attached_files=attached_file_context,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
                         yield result[ChatEvent.STATUS]
@@ -1049,6 +1056,7 @@ async def chat(
                 query_images=uploaded_images,
                 agent=agent,
                 tracer=tracer,
+                attached_files=attached_file_context,
             ):
                 if isinstance(result, dict) and ChatEvent.STATUS in result:
                     yield result[ChatEvent.STATUS]
@@ -1110,6 +1118,7 @@ async def chat(
                 agent=agent,
                 send_status_func=partial(send_event, ChatEvent.STATUS),
                 tracer=tracer,
+                attached_files=attached_file_context,
             ):
                 if isinstance(result, dict) and ChatEvent.STATUS in result:
                     yield result[ChatEvent.STATUS]
@@ -1166,6 +1175,7 @@ async def chat(
             uploaded_images,
             tracer,
             train_of_thought,
+            attached_file_context,
         )
 
         # Send Response
diff --git a/src/khoj/routers/helpers.py b/src/khoj/routers/helpers.py
index 990fa33f..760b6f2e 100644
--- a/src/khoj/routers/helpers.py
+++ b/src/khoj/routers/helpers.py
@@ -248,6 +248,25 @@ async def agenerate_chat_response(*args):
     return await loop.run_in_executor(executor, generate_chat_response, *args)
 
 
+async def gather_attached_files(
+    user: KhojUser,
+    file_filters: List[str],
+) -> str:
+    """
+    Gather contextual data from the given files
+    """
+    if len(file_filters) == 0:
+        return ""
+
+    file_objects = await FileObjectAdapters.async_get_file_objects_by_names(user, file_filters)
+
+    if len(file_objects) == 0:
+        return ""
+
+    contextual_data = " ".join([f"File: {file.file_name}\n\n{file.raw_text}" for file in file_objects])
+    return contextual_data
+
+
 async def acreate_title_from_query(query: str, user: KhojUser = None) -> str:
     """
     Create a title from the given query
@@ -294,6 +313,7 @@ async def aget_relevant_information_sources(
     query_images: List[str] = None,
     agent: Agent = None,
     tracer: dict = {},
+    attached_files: str = None,
 ):
     """
     Given a query, determine which of the available tools the agent should use in order to answer appropriately.
@@ -331,6 +351,7 @@ async def aget_relevant_information_sources(
             response_type="json_object",
             user=user,
             tracer=tracer,
+            attached_files=attached_files,
         )
 
     try:
@@ -440,6 +461,7 @@ async def infer_webpage_urls(
     query_images: List[str] = None,
     agent: Agent = None,
     tracer: dict = {},
+    attached_files: str = None,
 ) -> List[str]:
     """
     Infer webpage links from the given query
@@ -469,6 +491,7 @@ async def infer_webpage_urls(
             response_type="json_object",
             user=user,
             tracer=tracer,
+            attached_files=attached_files,
         )
 
     # Validate that the response is a non-empty, JSON-serializable list of URLs
@@ -494,6 +517,7 @@ async def generate_online_subqueries(
     query_images: List[str] = None,
     agent: Agent = None,
     tracer: dict = {},
+    attached_files: str = None,
 ) -> List[str]:
     """
     Generate subqueries from the given query
@@ -523,6 +547,7 @@ async def generate_online_subqueries(
             response_type="json_object",
             user=user,
             tracer=tracer,
+            attached_files=attached_files,
         )
 
     # Validate that the response is a non-empty, JSON-serializable list
@@ -645,6 +670,7 @@ async def generate_summary_from_files(
     agent: Agent = None,
     send_status_func: Optional[Callable] = None,
     tracer: dict = {},
+    attached_files: str = None,
 ):
     try:
         file_object = None
@@ -653,17 +679,28 @@ async def generate_summary_from_files(
             if len(file_names) > 0:
                 file_object = await FileObjectAdapters.async_get_file_objects_by_name(None, file_names.pop(), agent)
 
-        if len(file_filters) > 0:
-            file_object = await FileObjectAdapters.async_get_file_objects_by_name(user, file_filters[0])
-
-        if len(file_object) == 0:
+        if len(file_object) == 0 and not attached_files:
             response_log = "Sorry, I couldn't find the full text of this file."
             yield response_log
             return
-        contextual_data = " ".join([file.raw_text for file in file_object])
+
+        contextual_data = " ".join([f"File: {file.file_name}\n\n{file.raw_text}" for file in file_object])
+
+        if attached_files:
+            contextual_data += f"\n\n{attached_files}"
+
         if not q:
             q = "Create a general summary of the file"
-        async for result in send_status_func(f"**Constructing Summary Using:** {file_object[0].file_name}"):
+
+        file_names = [file.file_name for file in file_object]
+        file_names.extend(file_filters)
+
+        all_file_names = ""
+
+        for file_name in file_names:
+            all_file_names += f"- {file_name}\n"
+
+        async for result in send_status_func(f"**Constructing Summary Using:**\n{all_file_names}"):
             yield {ChatEvent.STATUS: result}
 
         response = await extract_relevant_summary(
@@ -694,6 +731,7 @@ async def generate_excalidraw_diagram(
     agent: Agent = None,
     send_status_func: Optional[Callable] = None,
     tracer: dict = {},
+    attached_files: str = None,
 ):
     if send_status_func:
         async for event in send_status_func("**Enhancing the Diagramming Prompt**"):
@@ -709,6 +747,7 @@ async def generate_excalidraw_diagram(
         user=user,
         agent=agent,
         tracer=tracer,
+        attached_files=attached_files,
     )
 
     if send_status_func:
@@ -735,6 +774,7 @@ async def generate_better_diagram_description(
     user: KhojUser = None,
     agent: Agent = None,
     tracer: dict = {},
+    attached_files: str = None,
 ) -> str:
     """
     Generate a diagram description from the given query and context
@@ -772,7 +812,11 @@ async def generate_better_diagram_description(
 
     with timer("Chat actor: Generate better diagram description", logger):
         response = await send_message_to_model_wrapper(
-            improve_diagram_description_prompt, query_images=query_images, user=user, tracer=tracer
+            improve_diagram_description_prompt,
+            query_images=query_images,
+            user=user,
+            tracer=tracer,
+            attached_files=attached_files,
         )
         response = response.strip()
         if response.startswith(('"', "'")) and response.endswith(('"', "'")):
@@ -820,6 +864,7 @@ async def generate_better_image_prompt(
     user: KhojUser = None,
     agent: Agent = None,
     tracer: dict = {},
+    attached_files: str = "",
 ) -> str:
     """
     Generate a better image prompt from the given query
@@ -867,7 +912,7 @@ async def generate_better_image_prompt(
 
     with timer("Chat actor: Generate contextual image prompt", logger):
         response = await send_message_to_model_wrapper(
-            image_prompt, query_images=query_images, user=user, tracer=tracer
+            image_prompt, query_images=query_images, user=user, tracer=tracer, attached_files=attached_files
         )
         response = response.strip()
         if response.startswith(('"', "'")) and response.endswith(('"', "'")):
@@ -884,6 +929,7 @@ async def send_message_to_model_wrapper(
     query_images: List[str] = None,
     context: str = "",
     tracer: dict = {},
+    attached_files: str = None,
 ):
     conversation_config: ChatModelOptions = await ConversationAdapters.aget_default_conversation_config(user)
     vision_available = conversation_config.vision_enabled
@@ -922,6 +968,7 @@ async def send_message_to_model_wrapper(
             max_prompt_size=max_tokens,
             vision_enabled=vision_available,
             model_type=conversation_config.model_type,
+            attached_files=attached_files,
         )
 
         return send_message_to_model_offline(
@@ -948,6 +995,7 @@ async def send_message_to_model_wrapper(
             vision_enabled=vision_available,
             query_images=query_images,
             model_type=conversation_config.model_type,
+            attached_files=attached_files,
         )
 
         return send_message_to_model(
@@ -970,6 +1018,7 @@ async def send_message_to_model_wrapper(
             vision_enabled=vision_available,
             query_images=query_images,
             model_type=conversation_config.model_type,
+            attached_files=attached_files,
         )
 
         return anthropic_send_message_to_model(
@@ -991,6 +1040,7 @@ async def send_message_to_model_wrapper(
             vision_enabled=vision_available,
             query_images=query_images,
             model_type=conversation_config.model_type,
+            attached_files=attached_files,
         )
 
         return gemini_send_message_to_model(
@@ -1006,6 +1056,7 @@ def send_message_to_model_wrapper_sync(
     response_type: str = "text",
     user: KhojUser = None,
     tracer: dict = {},
+    attached_files: str = "",
 ):
     conversation_config: ChatModelOptions = ConversationAdapters.get_default_conversation_config(user)
 
@@ -1029,6 +1080,7 @@ def send_message_to_model_wrapper_sync(
             max_prompt_size=max_tokens,
             vision_enabled=vision_available,
             model_type=conversation_config.model_type,
+            attached_files=attached_files,
         )
 
         return send_message_to_model_offline(
@@ -1050,6 +1102,7 @@ def send_message_to_model_wrapper_sync(
             max_prompt_size=max_tokens,
             vision_enabled=vision_available,
             model_type=conversation_config.model_type,
+            attached_files=attached_files,
         )
 
         openai_response = send_message_to_model(
@@ -1071,6 +1124,7 @@ def send_message_to_model_wrapper_sync(
             max_prompt_size=max_tokens,
             vision_enabled=vision_available,
             model_type=conversation_config.model_type,
+            attached_files=attached_files,
         )
 
         return anthropic_send_message_to_model(
@@ -1090,6 +1144,7 @@ def send_message_to_model_wrapper_sync(
             max_prompt_size=max_tokens,
             vision_enabled=vision_available,
             model_type=conversation_config.model_type,
+            attached_files=attached_files,
         )
 
         return gemini_send_message_to_model(
@@ -1121,6 +1176,7 @@ def generate_chat_response(
     query_images: Optional[List[str]] = None,
     tracer: dict = {},
     train_of_thought: List[Any] = [],
+    attached_files: str = None,
 ) -> Tuple[Union[ThreadedGenerator, Iterator[str]], Dict[str, str]]:
     # Initialize Variables
     chat_response = None
@@ -1173,6 +1229,7 @@ def generate_chat_response(
                 user_name=user_name,
                 agent=agent,
                 tracer=tracer,
+                attached_files=attached_files,
             )
 
         elif conversation_config.model_type == ChatModelOptions.ModelType.OPENAI:
@@ -1198,6 +1255,7 @@ def generate_chat_response(
                 agent=agent,
                 vision_available=vision_available,
                 tracer=tracer,
+                attached_files=attached_files,
             )
 
         elif conversation_config.model_type == ChatModelOptions.ModelType.ANTHROPIC:
@@ -1220,6 +1278,7 @@ def generate_chat_response(
                 agent=agent,
                 vision_available=vision_available,
                 tracer=tracer,
+                attached_files=attached_files,
             )
         elif conversation_config.model_type == ChatModelOptions.ModelType.GOOGLE:
             api_key = conversation_config.openai_config.api_key
@@ -1240,6 +1299,7 @@ def generate_chat_response(
                 agent=agent,
                 vision_available=vision_available,
                 tracer=tracer,
+                attached_files=attached_files,
             )
 
         metadata.update({"chat_model": conversation_config.chat_model})
diff --git a/src/khoj/routers/research.py b/src/khoj/routers/research.py
index 4f9c6b4e..960cf52f 100644
--- a/src/khoj/routers/research.py
+++ b/src/khoj/routers/research.py
@@ -47,6 +47,7 @@ async def apick_next_tool(
     max_iterations: int = 5,
     send_status_func: Optional[Callable] = None,
     tracer: dict = {},
+    attached_files: str = None,
 ):
     """
     Given a query, determine which of the available tools the agent should use in order to answer appropriately. One at a time, and it's able to use subsequent iterations to refine the answer.
@@ -95,6 +96,7 @@ async def apick_next_tool(
             user=user,
             query_images=query_images,
             tracer=tracer,
+            attached_files=attached_files,
         )
 
     try:
@@ -137,6 +139,7 @@ async def execute_information_collection(
     location: LocationData = None,
     file_filters: List[str] = [],
     tracer: dict = {},
+    attached_files: str = None,
 ):
     current_iteration = 0
     MAX_ITERATIONS = 5
@@ -161,6 +164,7 @@ async def execute_information_collection(
             MAX_ITERATIONS,
             send_status_func,
             tracer=tracer,
+            attached_files=attached_files,
         ):
             if isinstance(result, dict) and ChatEvent.STATUS in result:
                 yield result[ChatEvent.STATUS]
@@ -233,6 +237,7 @@ async def execute_information_collection(
                     query_images=query_images,
                     agent=agent,
                     tracer=tracer,
+                    attached_files=attached_files,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
                         yield result[ChatEvent.STATUS]
@@ -264,6 +269,7 @@ async def execute_information_collection(
                     query_images=query_images,
                     agent=agent,
                     tracer=tracer,
+                    attached_files=attached_files,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
                         yield result[ChatEvent.STATUS]
@@ -288,6 +294,7 @@ async def execute_information_collection(
                     query_images=query_images,
                     agent=agent,
                     send_status_func=send_status_func,
+                    attached_files=attached_files,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
                         yield result[ChatEvent.STATUS]

From a27b8d3e5462d1e55cf13e0c584e67b3ce49057a Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Mon, 4 Nov 2024 16:51:37 -0800
Subject: [PATCH 02/42] Remove summarize condition for only 1 file filter

---
 src/khoj/routers/api_chat.py | 4 ----
 1 file changed, 4 deletions(-)

diff --git a/src/khoj/routers/api_chat.py b/src/khoj/routers/api_chat.py
index bb561ca5..a9a6f09f 100644
--- a/src/khoj/routers/api_chat.py
+++ b/src/khoj/routers/api_chat.py
@@ -801,10 +801,6 @@ async def chat(
                 response_log = "No files selected for summarization. Please add files using the section on the left."
                 async for result in send_llm_response(response_log):
                     yield result
-            elif len(file_filters) > 1 and not agent_has_entries:
-                response_log = "Only one file can be selected for summarization."
-                async for result in send_llm_response(response_log):
-                    yield result
             else:
                 async for response in generate_summary_from_files(
                     q=q,

From 3dc9139cee9f9e9d21c1d500f015aef68e6b0d7d Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Mon, 4 Nov 2024 16:53:07 -0800
Subject: [PATCH 03/42] Add additional handling for when file_object comes back
 empty

---
 src/khoj/routers/helpers.py | 14 ++++++++------
 1 file changed, 8 insertions(+), 6 deletions(-)

diff --git a/src/khoj/routers/helpers.py b/src/khoj/routers/helpers.py
index 760b6f2e..bf010034 100644
--- a/src/khoj/routers/helpers.py
+++ b/src/khoj/routers/helpers.py
@@ -673,18 +673,20 @@ async def generate_summary_from_files(
     attached_files: str = None,
 ):
     try:
-        file_object = None
+        file_objects = None
         if await EntryAdapters.aagent_has_entries(agent):
             file_names = await EntryAdapters.aget_agent_entry_filepaths(agent)
             if len(file_names) > 0:
-                file_object = await FileObjectAdapters.async_get_file_objects_by_name(None, file_names.pop(), agent)
+                file_objects = await FileObjectAdapters.async_get_file_objects_by_name(None, file_names.pop(), agent)
 
-        if len(file_object) == 0 and not attached_files:
-            response_log = "Sorry, I couldn't find the full text of this file."
+        if (file_objects and len(file_objects) == 0 and not attached_files) or (
+            not file_objects and not attached_files
+        ):
+            response_log = "Sorry, I couldn't find anything to summarize."
             yield response_log
             return
 
-        contextual_data = " ".join([f"File: {file.file_name}\n\n{file.raw_text}" for file in file_object])
+        contextual_data = " ".join([f"File: {file.file_name}\n\n{file.raw_text}" for file in file_objects])
 
         if attached_files:
             contextual_data += f"\n\n{attached_files}"
@@ -692,7 +694,7 @@ async def generate_summary_from_files(
         if not q:
             q = "Create a general summary of the file"
 
-        file_names = [file.file_name for file in file_object]
+        file_names = [file.file_name for file in file_objects]
         file_names.extend(file_filters)
 
         all_file_names = ""

From 1f372bf2b1268aee47f26187b6b9d246191c7f9d Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Mon, 4 Nov 2024 17:45:54 -0800
Subject: [PATCH 04/42] Update file summarization unit tests now that multiple
 files are allowed

---
 tests/test_offline_chat_director.py | 7 ++-----
 tests/test_openai_chat_director.py  | 5 +----
 2 files changed, 3 insertions(+), 9 deletions(-)

diff --git a/tests/test_offline_chat_director.py b/tests/test_offline_chat_director.py
index afb5d4ce..f8285f40 100644
--- a/tests/test_offline_chat_director.py
+++ b/tests/test_offline_chat_director.py
@@ -10,7 +10,7 @@ from khoj.processor.conversation.utils import message_to_log
 from khoj.routers.helpers import aget_relevant_information_sources
 from tests.helpers import ConversationFactory
 
-SKIP_TESTS = True
+SKIP_TESTS = False
 pytestmark = pytest.mark.skipif(
     SKIP_TESTS,
     reason="Disable in CI to avoid long test runs.",
@@ -337,7 +337,6 @@ def test_summarize_one_file(client_offline_chat, default_user2: KhojUser):
     # Assert
     assert response_message != ""
     assert response_message != "No files selected for summarization. Please add files using the section on the left."
-    assert response_message != "Only one file can be selected for summarization."
 
 
 @pytest.mark.django_db(transaction=True)
@@ -375,7 +374,6 @@ def test_summarize_extra_text(client_offline_chat, default_user2: KhojUser):
     # Assert
     assert response_message != ""
     assert response_message != "No files selected for summarization. Please add files using the section on the left."
-    assert response_message != "Only one file can be selected for summarization."
 
 
 @pytest.mark.django_db(transaction=True)
@@ -404,7 +402,7 @@ def test_summarize_multiple_files(client_offline_chat, default_user2: KhojUser):
     response_message = response.json()["response"]
 
     # Assert
-    assert response_message == "Only one file can be selected for summarization."
+    assert response_message is not None
 
 
 @pytest.mark.django_db(transaction=True)
@@ -460,7 +458,6 @@ def test_summarize_different_conversation(client_offline_chat, default_user2: Kh
     # Assert
     assert response_message != ""
     assert response_message != "No files selected for summarization. Please add files using the section on the left."
-    assert response_message != "Only one file can be selected for summarization."
 
 
 @pytest.mark.django_db(transaction=True)
diff --git a/tests/test_openai_chat_director.py b/tests/test_openai_chat_director.py
index 7d460408..56dde6d3 100644
--- a/tests/test_openai_chat_director.py
+++ b/tests/test_openai_chat_director.py
@@ -312,7 +312,6 @@ def test_summarize_one_file(chat_client, default_user2: KhojUser):
     # Assert
     assert response_message != ""
     assert response_message != "No files selected for summarization. Please add files using the section on the left."
-    assert response_message != "Only one file can be selected for summarization."
 
 
 @pytest.mark.django_db(transaction=True)
@@ -344,7 +343,6 @@ def test_summarize_extra_text(chat_client, default_user2: KhojUser):
     # Assert
     assert response_message != ""
     assert response_message != "No files selected for summarization. Please add files using the section on the left."
-    assert response_message != "Only one file can be selected for summarization."
 
 
 @pytest.mark.django_db(transaction=True)
@@ -371,7 +369,7 @@ def test_summarize_multiple_files(chat_client, default_user2: KhojUser):
     response_message = response.json()["response"]
 
     # Assert
-    assert response_message == "Only one file can be selected for summarization."
+    assert response_message is not None
 
 
 @pytest.mark.django_db(transaction=True)
@@ -435,7 +433,6 @@ def test_summarize_different_conversation(chat_client, default_user2: KhojUser):
     assert (
         response_message_conv1 != "No files selected for summarization. Please add files using the section on the left."
     )
-    assert response_message_conv1 != "Only one file can be selected for summarization."
 
 
 @pytest.mark.django_db(transaction=True)

From cf0bcec0e7ec7b179c8bfffbe03be5d230bb7bda Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Mon, 4 Nov 2024 19:06:54 -0800
Subject: [PATCH 05/42] Revert SKIP_TESTS flag in offline chat director tests

---
 tests/test_offline_chat_director.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/tests/test_offline_chat_director.py b/tests/test_offline_chat_director.py
index f8285f40..45f540ed 100644
--- a/tests/test_offline_chat_director.py
+++ b/tests/test_offline_chat_director.py
@@ -10,7 +10,7 @@ from khoj.processor.conversation.utils import message_to_log
 from khoj.routers.helpers import aget_relevant_information_sources
 from tests.helpers import ConversationFactory
 
-SKIP_TESTS = False
+SKIP_TESTS = True
 pytestmark = pytest.mark.skipif(
     SKIP_TESTS,
     reason="Disable in CI to avoid long test runs.",

From dc26da0a12762c71ae2650c903c1c9bfdbfd90f4 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Mon, 4 Nov 2024 22:00:47 -0800
Subject: [PATCH 06/42] Add uploaded files in the conversation file filter for
 a new convo

---
 src/interface/web/app/page.tsx | 21 ++++++++++++++++++++-
 1 file changed, 20 insertions(+), 1 deletion(-)

diff --git a/src/interface/web/app/page.tsx b/src/interface/web/app/page.tsx
index 532b4420..1b714414 100644
--- a/src/interface/web/app/page.tsx
+++ b/src/interface/web/app/page.tsx
@@ -30,6 +30,7 @@ import { useRouter, useSearchParams } from "next/navigation";
 import { ScrollArea, ScrollBar } from "@/components/ui/scroll-area";
 import { AgentCard } from "@/app/components/agentCard/agentCard";
 import { Popover, PopoverContent, PopoverTrigger } from "@/components/ui/popover";
+import { modifyFileFilterForConversation } from "./common/chatFunctions";
 
 interface ChatBodyDataProps {
     chatOptionsData: ChatOptions | null;
@@ -150,12 +151,26 @@ function ChatBodyData(props: ChatBodyDataProps) {
                 setProcessingMessage(true);
                 try {
                     const newConversationId = await createNewConversation(selectedAgent || "khoj");
+                    const uploadedFiles = localStorage.getItem("uploadedFiles");
                     onConversationIdChange?.(newConversationId);
                     localStorage.setItem("message", message);
                     if (images.length > 0) {
                         localStorage.setItem("images", JSON.stringify(images));
                     }
-                    window.location.href = `/chat?conversationId=${newConversationId}`;
+
+                    if (uploadedFiles) {
+                        modifyFileFilterForConversation(
+                            newConversationId,
+                            JSON.parse(uploadedFiles),
+                            () => {
+                                window.location.href = `/chat?conversationId=${newConversationId}`;
+                            },
+                            "add",
+                        );
+                        localStorage.removeItem("uploadedFiles");
+                    } else {
+                        window.location.href = `/chat?conversationId=${newConversationId}`;
+                    }
                 } catch (error) {
                     console.error("Error creating new conversation:", error);
                     setProcessingMessage(false);
@@ -417,6 +432,10 @@ export default function Home() {
         setUserConfig(initialUserConfig);
     }, [initialUserConfig]);
 
+    useEffect(() => {
+        localStorage.setItem("uploadedFiles", JSON.stringify(uploadedFiles));
+    }, [uploadedFiles]);
+
     useEffect(() => {
         fetch("/api/chat/options")
             .then((response) => response.json())

From a0480d5f6c741ceabf2cb8a9406fb37d7af09113 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Mon, 4 Nov 2024 22:01:09 -0800
Subject: [PATCH 07/42] use fill weight for the toggle right (enabled state)
 for research mode

---
 src/interface/web/app/components/chatInputArea/chatInputArea.tsx | 1 +
 1 file changed, 1 insertion(+)

diff --git a/src/interface/web/app/components/chatInputArea/chatInputArea.tsx b/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
index 74e15523..9f8f8c18 100644
--- a/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
+++ b/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
@@ -582,6 +582,7 @@ export const ChatInputArea = forwardRef<HTMLTextAreaElement, ChatInputProps>((pr
                                 <span className="text-muted-foreground text-sm">Research Mode</span>
                                 {useResearchMode ? (
                                     <ToggleRight
+                                        weight="fill"
                                         className={`w-6 h-6 inline-block ${props.agentColor ? convertColorToTextClass(props.agentColor) : convertColorToTextClass("orange")} rounded-full`}
                                     />
                                 ) : (

From de73cbc6106ede0d02db64da707c2cb96acd8655 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Thu, 7 Nov 2024 15:58:52 -0800
Subject: [PATCH 08/42] Add support for relaying attached files through backend
 calls to models

---
 .../conversation/anthropic/anthropic_chat.py  |  8 +-
 .../conversation/google/gemini_chat.py        |  9 ++-
 src/khoj/processor/conversation/openai/gpt.py |  8 +-
 src/khoj/processor/conversation/utils.py      | 49 +++++++-----
 src/khoj/processor/tools/run_code.py          | 10 +--
 src/khoj/routers/helpers.py                   | 80 ++++++++++++-------
 src/khoj/routers/research.py                  |  2 +-
 src/khoj/utils/rawconfig.py                   | 32 ++++++++
 8 files changed, 136 insertions(+), 62 deletions(-)

diff --git a/src/khoj/processor/conversation/anthropic/anthropic_chat.py b/src/khoj/processor/conversation/anthropic/anthropic_chat.py
index df81f56f..c171c8fb 100644
--- a/src/khoj/processor/conversation/anthropic/anthropic_chat.py
+++ b/src/khoj/processor/conversation/anthropic/anthropic_chat.py
@@ -37,6 +37,7 @@ def extract_questions_anthropic(
     vision_enabled: bool = False,
     personality_context: Optional[str] = None,
     tracer: dict = {},
+    attached_files: str = None,
 ):
     """
     Infer search queries to retrieve relevant notes to answer user query
@@ -84,7 +85,12 @@ def extract_questions_anthropic(
         vision_enabled=vision_enabled,
     )
 
-    messages = [ChatMessage(content=prompt, role="user")]
+    messages = []
+
+    if attached_files:
+        messages.append(ChatMessage(content=attached_files, role="user"))
+
+    messages.append(ChatMessage(content=prompt, role="user"))
 
     response = anthropic_completion_with_backoff(
         messages=messages,
diff --git a/src/khoj/processor/conversation/google/gemini_chat.py b/src/khoj/processor/conversation/google/gemini_chat.py
index b7ec018d..6d257faa 100644
--- a/src/khoj/processor/conversation/google/gemini_chat.py
+++ b/src/khoj/processor/conversation/google/gemini_chat.py
@@ -38,6 +38,7 @@ def extract_questions_gemini(
     vision_enabled: bool = False,
     personality_context: Optional[str] = None,
     tracer: dict = {},
+    attached_files: str = None,
 ):
     """
     Infer search queries to retrieve relevant notes to answer user query
@@ -85,7 +86,13 @@ def extract_questions_gemini(
         vision_enabled=vision_enabled,
     )
 
-    messages = [ChatMessage(content=prompt, role="user"), ChatMessage(content=system_prompt, role="system")]
+    messages = []
+
+    if attached_files:
+        messages.append(ChatMessage(content=attached_files, role="user"))
+
+    messages.append(ChatMessage(content=prompt, role="user"))
+    messages.append(ChatMessage(content=system_prompt, role="system"))
 
     response = gemini_send_message_to_model(
         messages, api_key, model, response_type="json_object", temperature=temperature, tracer=tracer
diff --git a/src/khoj/processor/conversation/openai/gpt.py b/src/khoj/processor/conversation/openai/gpt.py
index bdb67448..65cdfa3f 100644
--- a/src/khoj/processor/conversation/openai/gpt.py
+++ b/src/khoj/processor/conversation/openai/gpt.py
@@ -35,6 +35,7 @@ def extract_questions(
     vision_enabled: bool = False,
     personality_context: Optional[str] = None,
     tracer: dict = {},
+    attached_files: str = None,
 ):
     """
     Infer search queries to retrieve relevant notes to answer user query
@@ -81,7 +82,12 @@ def extract_questions(
         vision_enabled=vision_enabled,
     )
 
-    messages = [ChatMessage(content=prompt, role="user")]
+    messages = []
+
+    if attached_files:
+        messages.append(ChatMessage(content=attached_files, role="user"))
+
+    messages.append(ChatMessage(content=prompt, role="user"))
 
     response = send_message_to_model(
         messages,
diff --git a/src/khoj/processor/conversation/utils.py b/src/khoj/processor/conversation/utils.py
index b510a09a..791a98e0 100644
--- a/src/khoj/processor/conversation/utils.py
+++ b/src/khoj/processor/conversation/utils.py
@@ -36,6 +36,7 @@ from khoj.utils.helpers import (
     is_none_or_empty,
     merge_dicts,
 )
+from khoj.utils.rawconfig import FileAttachment
 
 logger = logging.getLogger(__name__)
 
@@ -137,25 +138,6 @@ def construct_iteration_history(
     return previous_iterations_history
 
 
-def construct_chat_history(conversation_history: dict, n: int = 4, agent_name="AI") -> str:
-    chat_history = ""
-    for chat in conversation_history.get("chat", [])[-n:]:
-        if chat["by"] == "khoj" and chat["intent"].get("type") in ["remember", "reminder", "summarize"]:
-            chat_history += f"User: {chat['intent']['query']}\n"
-
-            if chat["intent"].get("inferred-queries"):
-                chat_history += f'Khoj: {{"queries": {chat["intent"].get("inferred-queries")}}}\n'
-
-            chat_history += f"{agent_name}: {chat['message']}\n\n"
-        elif chat["by"] == "khoj" and ("text-to-image" in chat["intent"].get("type")):
-            chat_history += f"User: {chat['intent']['query']}\n"
-            chat_history += f"{agent_name}: [generated image redacted for space]\n"
-        elif chat["by"] == "khoj" and ("excalidraw" in chat["intent"].get("type")):
-            chat_history += f"User: {chat['intent']['query']}\n"
-            chat_history += f"{agent_name}: {chat['intent']['inferred-queries'][0]}\n"
-    return chat_history
-
-
 def construct_tool_chat_history(
     previous_iterations: List[InformationCollectionIteration], tool: ConversationCommand = None
 ) -> Dict[str, list]:
@@ -241,6 +223,7 @@ def save_to_conversation_log(
     conversation_id: str = None,
     automation_id: str = None,
     query_images: List[str] = None,
+    raw_attached_files: List[FileAttachment] = [],
     tracer: Dict[str, Any] = {},
     train_of_thought: List[Any] = [],
 ):
@@ -253,6 +236,7 @@ def save_to_conversation_log(
             "created": user_message_time,
             "images": query_images,
             "turnId": turn_id,
+            "attachedFiles": [file.model_dump(mode="json") for file in raw_attached_files],
         },
         khoj_message_metadata={
             "context": compiled_references,
@@ -306,6 +290,22 @@ def construct_structured_message(message: str, images: list[str], model_type: st
     return message
 
 
+def gather_raw_attached_files(
+    attached_files: Dict[str, str],
+):
+    """_summary_
+    Gather contextual data from the given (raw) files
+    """
+
+    if len(attached_files) == 0:
+        return ""
+
+    contextual_data = " ".join(
+        [f"File: {file_name}\n\n{file_content}\n\n" for file_name, file_content in attached_files.items()]
+    )
+    return f"I have attached the following files:\n\n{contextual_data}"
+
+
 def generate_chatml_messages_with_context(
     user_message,
     system_message=None,
@@ -335,6 +335,8 @@ def generate_chatml_messages_with_context(
     chatml_messages: List[ChatMessage] = []
     for chat in conversation_log.get("chat", []):
         message_context = ""
+        message_attached_files = ""
+
         if chat["by"] == "khoj" and "excalidraw" in chat["intent"].get("type", ""):
             message_context += chat.get("intent").get("inferred-queries")[0]
         if not is_none_or_empty(chat.get("context")):
@@ -343,6 +345,15 @@ def generate_chatml_messages_with_context(
             )
             message_context += f"{prompts.notes_conversation.format(references=references)}\n\n"
 
+        if chat.get("attachedFiles"):
+            raw_attached_files = chat.get("attachedFiles")
+            attached_files_dict = dict()
+            for file in raw_attached_files:
+                attached_files_dict[file["name"]] = file["content"]
+
+            message_attached_files = gather_raw_attached_files(attached_files_dict)
+            chatml_messages.append(ChatMessage(content=message_attached_files, role="user"))
+
         if not is_none_or_empty(chat.get("onlineContext")):
             message_context += f"{prompts.online_search_conversation.format(online_results=chat.get('onlineContext'))}"
 
diff --git a/src/khoj/processor/tools/run_code.py b/src/khoj/processor/tools/run_code.py
index 86388aee..418ab3a2 100644
--- a/src/khoj/processor/tools/run_code.py
+++ b/src/khoj/processor/tools/run_code.py
@@ -6,18 +6,12 @@ import os
 from typing import Any, Callable, List, Optional
 
 import aiohttp
-import requests
 
 from khoj.database.adapters import ais_user_subscribed
 from khoj.database.models import Agent, KhojUser
 from khoj.processor.conversation import prompts
-from khoj.processor.conversation.utils import (
-    ChatEvent,
-    clean_code_python,
-    clean_json,
-    construct_chat_history,
-)
-from khoj.routers.helpers import send_message_to_model_wrapper
+from khoj.processor.conversation.utils import ChatEvent, clean_code_python, clean_json
+from khoj.routers.helpers import construct_chat_history, send_message_to_model_wrapper
 from khoj.utils.helpers import timer
 from khoj.utils.rawconfig import LocationData
 
diff --git a/src/khoj/routers/helpers.py b/src/khoj/routers/helpers.py
index bf010034..c62fe4bf 100644
--- a/src/khoj/routers/helpers.py
+++ b/src/khoj/routers/helpers.py
@@ -91,7 +91,6 @@ from khoj.processor.conversation.utils import (
     ChatEvent,
     ThreadedGenerator,
     clean_json,
-    construct_chat_history,
     generate_chatml_messages_with_context,
     save_to_conversation_log,
 )
@@ -104,6 +103,7 @@ from khoj.utils.config import OfflineChatProcessorModel
 from khoj.utils.helpers import (
     LRU,
     ConversationCommand,
+    get_file_type,
     is_none_or_empty,
     is_valid_url,
     log_telemetry,
@@ -111,7 +111,7 @@ from khoj.utils.helpers import (
     timer,
     tool_descriptions_for_llm,
 )
-from khoj.utils.rawconfig import LocationData
+from khoj.utils.rawconfig import ChatRequestBody, FileAttachment, FileData, LocationData
 
 logger = logging.getLogger(__name__)
 
@@ -167,6 +167,12 @@ async def is_ready_to_chat(user: KhojUser):
     raise HTTPException(status_code=500, detail="Set your OpenAI API key or enable Local LLM via Khoj settings.")
 
 
+def get_file_content(file: UploadFile):
+    file_content = file.file.read()
+    file_type, encoding = get_file_type(file.content_type, file_content)
+    return FileData(name=file.filename, content=file_content, file_type=file_type, encoding=encoding)
+
+
 def update_telemetry_state(
     request: Request,
     telemetry_type: str,
@@ -248,23 +254,49 @@ async def agenerate_chat_response(*args):
     return await loop.run_in_executor(executor, generate_chat_response, *args)
 
 
-async def gather_attached_files(
-    user: KhojUser,
-    file_filters: List[str],
-) -> str:
+def gather_raw_attached_files(
+    attached_files: Dict[str, str],
+):
+    """_summary_
+    Gather contextual data from the given (raw) files
     """
-    Gather contextual data from the given files
-    """
-    if len(file_filters) == 0:
+
+    if len(attached_files) == 0:
         return ""
 
-    file_objects = await FileObjectAdapters.async_get_file_objects_by_names(user, file_filters)
+    contextual_data = " ".join(
+        [f"File: {file_name}\n\n{file_content}\n\n" for file_name, file_content in attached_files.items()]
+    )
+    return f"I have attached the following files:\n\n{contextual_data}"
 
-    if len(file_objects) == 0:
-        return ""
 
-    contextual_data = " ".join([f"File: {file.file_name}\n\n{file.raw_text}" for file in file_objects])
-    return contextual_data
+def construct_chat_history(conversation_history: dict, n: int = 4, agent_name="AI") -> str:
+    chat_history = ""
+    for chat in conversation_history.get("chat", [])[-n:]:
+        if chat["by"] == "khoj" and chat["intent"].get("type") in ["remember", "reminder", "summarize"]:
+            chat_history += f"User: {chat['intent']['query']}\n"
+
+            if chat["intent"].get("inferred-queries"):
+                chat_history += f'{agent_name}: {{"queries": {chat["intent"].get("inferred-queries")}}}\n'
+
+            chat_history += f"{agent_name}: {chat['message']}\n\n"
+        elif chat["by"] == "khoj" and ("text-to-image" in chat["intent"].get("type")):
+            chat_history += f"User: {chat['intent']['query']}\n"
+            chat_history += f"{agent_name}: [generated image redacted for space]\n"
+        elif chat["by"] == "khoj" and ("excalidraw" in chat["intent"].get("type")):
+            chat_history += f"User: {chat['intent']['query']}\n"
+            chat_history += f"{agent_name}: {chat['intent']['inferred-queries'][0]}\n"
+        elif chat["by"] == "you":
+            raw_attached_files = chat.get("attachedFiles")
+            if raw_attached_files:
+                attached_files: Dict[str, str] = {}
+                for file in raw_attached_files:
+                    attached_files[file["name"]] = file["content"]
+
+                attached_file_context = gather_raw_attached_files(attached_files)
+                chat_history += f"User: {attached_file_context}\n"
+
+    return chat_history
 
 
 async def acreate_title_from_query(query: str, user: KhojUser = None) -> str:
@@ -1179,6 +1211,7 @@ def generate_chat_response(
     tracer: dict = {},
     train_of_thought: List[Any] = [],
     attached_files: str = None,
+    raw_attached_files: List[FileAttachment] = None,
 ) -> Tuple[Union[ThreadedGenerator, Iterator[str]], Dict[str, str]]:
     # Initialize Variables
     chat_response = None
@@ -1204,6 +1237,7 @@ def generate_chat_response(
             query_images=query_images,
             tracer=tracer,
             train_of_thought=train_of_thought,
+            raw_attached_files=raw_attached_files,
         )
 
         conversation_config = ConversationAdapters.get_valid_conversation_config(user, conversation)
@@ -1299,6 +1333,7 @@ def generate_chat_response(
                 location_data=location_data,
                 user_name=user_name,
                 agent=agent,
+                query_images=query_images,
                 vision_available=vision_available,
                 tracer=tracer,
                 attached_files=attached_files,
@@ -1313,23 +1348,6 @@ def generate_chat_response(
     return chat_response, metadata
 
 
-class ChatRequestBody(BaseModel):
-    q: str
-    n: Optional[int] = 7
-    d: Optional[float] = None
-    stream: Optional[bool] = False
-    title: Optional[str] = None
-    conversation_id: Optional[str] = None
-    turn_id: Optional[str] = None
-    city: Optional[str] = None
-    region: Optional[str] = None
-    country: Optional[str] = None
-    country_code: Optional[str] = None
-    timezone: Optional[str] = None
-    images: Optional[list[str]] = None
-    create_new: Optional[bool] = False
-
-
 class DeleteMessageRequestBody(BaseModel):
     conversation_id: str
     turn_id: str
diff --git a/src/khoj/routers/research.py b/src/khoj/routers/research.py
index 960cf52f..dc34009c 100644
--- a/src/khoj/routers/research.py
+++ b/src/khoj/routers/research.py
@@ -20,7 +20,6 @@ from khoj.routers.api import extract_references_and_questions
 from khoj.routers.helpers import (
     ChatEvent,
     construct_chat_history,
-    extract_relevant_info,
     generate_summary_from_files,
     send_message_to_model_wrapper,
 )
@@ -187,6 +186,7 @@ async def execute_information_collection(
                 query_images,
                 agent=agent,
                 tracer=tracer,
+                attached_files=attached_files,
             ):
                 if isinstance(result, dict) and ChatEvent.STATUS in result:
                     yield result[ChatEvent.STATUS]
diff --git a/src/khoj/utils/rawconfig.py b/src/khoj/utils/rawconfig.py
index 15f5ea01..2c956c2c 100644
--- a/src/khoj/utils/rawconfig.py
+++ b/src/khoj/utils/rawconfig.py
@@ -138,6 +138,38 @@ class SearchResponse(ConfigBase):
     corpus_id: str
 
 
+class FileData(BaseModel):
+    name: str
+    content: bytes
+    file_type: str
+    encoding: str | None = None
+
+
+class FileAttachment(BaseModel):
+    name: str
+    content: str
+    file_type: str
+    size: int
+
+
+class ChatRequestBody(BaseModel):
+    q: str
+    n: Optional[int] = 7
+    d: Optional[float] = None
+    stream: Optional[bool] = False
+    title: Optional[str] = None
+    conversation_id: Optional[str] = None
+    turn_id: Optional[str] = None
+    city: Optional[str] = None
+    region: Optional[str] = None
+    country: Optional[str] = None
+    country_code: Optional[str] = None
+    timezone: Optional[str] = None
+    images: Optional[list[str]] = None
+    files: Optional[list[FileAttachment]] = None
+    create_new: Optional[bool] = False
+
+
 class Entry:
     raw: str
     compiled: str

From 3b1e8462cd6daf60216c679e76d617efac1932a2 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Thu, 7 Nov 2024 15:59:15 -0800
Subject: [PATCH 09/42] Include attach files in calls to extract questions

---
 src/khoj/routers/api.py | 5 +++++
 1 file changed, 5 insertions(+)

diff --git a/src/khoj/routers/api.py b/src/khoj/routers/api.py
index bed7c27b..5474497d 100644
--- a/src/khoj/routers/api.py
+++ b/src/khoj/routers/api.py
@@ -351,6 +351,7 @@ async def extract_references_and_questions(
     query_images: Optional[List[str]] = None,
     agent: Agent = None,
     tracer: dict = {},
+    attached_files: str = None,
 ):
     user = request.user.object if request.user.is_authenticated else None
 
@@ -425,6 +426,7 @@ async def extract_references_and_questions(
                 max_prompt_size=conversation_config.max_prompt_size,
                 personality_context=personality_context,
                 tracer=tracer,
+                attached_files=attached_files,
             )
         elif conversation_config.model_type == ChatModelOptions.ModelType.OPENAI:
             openai_chat_config = conversation_config.openai_config
@@ -443,6 +445,7 @@ async def extract_references_and_questions(
                 vision_enabled=vision_enabled,
                 personality_context=personality_context,
                 tracer=tracer,
+                attached_files=attached_files,
             )
         elif conversation_config.model_type == ChatModelOptions.ModelType.ANTHROPIC:
             api_key = conversation_config.openai_config.api_key
@@ -458,6 +461,7 @@ async def extract_references_and_questions(
                 vision_enabled=vision_enabled,
                 personality_context=personality_context,
                 tracer=tracer,
+                attached_files=attached_files,
             )
         elif conversation_config.model_type == ChatModelOptions.ModelType.GOOGLE:
             api_key = conversation_config.openai_config.api_key
@@ -474,6 +478,7 @@ async def extract_references_and_questions(
                 vision_enabled=vision_enabled,
                 personality_context=personality_context,
                 tracer=tracer,
+                attached_files=attached_files,
             )
 
     # Collate search results as context for GPT

From 394035136d791cf6ef74b0d822b7b999b2815bc4 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Thu, 7 Nov 2024 16:00:10 -0800
Subject: [PATCH 10/42] Add an api that gets a document, and converts it to
 just text

---
 src/khoj/routers/api_content.py | 61 ++++++++++++++++++++++++++++++---
 1 file changed, 56 insertions(+), 5 deletions(-)

diff --git a/src/khoj/routers/api_content.py b/src/khoj/routers/api_content.py
index 72b304ef..d5a6f2ad 100644
--- a/src/khoj/routers/api_content.py
+++ b/src/khoj/routers/api_content.py
@@ -36,16 +36,18 @@ from khoj.database.models import (
     LocalPlaintextConfig,
     NotionConfig,
 )
+from khoj.processor.content.docx.docx_to_entries import DocxToEntries
+from khoj.processor.content.pdf.pdf_to_entries import PdfToEntries
 from khoj.routers.helpers import (
     ApiIndexedDataLimiter,
     CommonQueryParams,
     configure_content,
+    get_file_content,
     get_user_config,
     update_telemetry_state,
 )
 from khoj.utils import constants, state
 from khoj.utils.config import SearchModels
-from khoj.utils.helpers import get_file_type
 from khoj.utils.rawconfig import (
     ContentConfig,
     FullConfig,
@@ -375,6 +377,54 @@ async def delete_content_source(
     return {"status": "ok"}
 
 
+@api_content.post("/convert", status_code=200)
+@requires(["authenticated"])
+async def convert_documents(
+    request: Request,
+    files: List[UploadFile],
+    client: Optional[str] = None,
+):
+    converted_files = []
+    supported_files = ["org", "markdown", "pdf", "plaintext", "docx"]
+
+    for file in files:
+        file_data = get_file_content(file)
+        if file_data.file_type in supported_files:
+            extracted_content = (
+                file_data.content.decode(file_data.encoding) if file_data.encoding else file_data.content
+            )
+
+            if file_data.file_type == "docx":
+                entries_per_page = DocxToEntries.extract_text(file_data.content)
+                extracted_content = "\n".join(entries_per_page)
+
+            elif file_data.file_type == "pdf":
+                entries_per_page = PdfToEntries.extract_text(file_data.content)
+                extracted_content = "\n".join(entries_per_page)
+
+            size_in_bytes = len(extracted_content.encode("utf-8"))
+
+            converted_files.append(
+                {
+                    "name": file_data.name,
+                    "content": extracted_content,
+                    "file_type": file_data.file_type,
+                    "size": size_in_bytes,
+                }
+            )
+        else:
+            logger.warning(f"Skipped converting unsupported file type sent by {client} client: {file.filename}")
+
+    update_telemetry_state(
+        request=request,
+        telemetry_type="api",
+        api="convert_documents",
+        client=client,
+    )
+
+    return Response(content=json.dumps(converted_files), media_type="application/json", status_code=200)
+
+
 async def indexer(
     request: Request,
     files: list[UploadFile],
@@ -398,10 +448,11 @@ async def indexer(
     try:
         logger.info(f"📬 Updating content index via API call by {client} client")
         for file in files:
-            file_content = file.file.read()
-            file_type, encoding = get_file_type(file.content_type, file_content)
-            if file_type in index_files:
-                index_files[file_type][file.filename] = file_content.decode(encoding) if encoding else file_content
+            file_data = get_file_content(file)
+            if file_data.file_type in index_files:
+                index_files[file_data.file_type][file_data.filename] = (
+                    file_data.content.decode(file_data.encoding) if file_data.encoding else file_data.content
+                )
             else:
                 logger.warning(f"Skipped indexing unsupported file type sent by {client} client: {file.filename}")
 

From ecc81e06a7ecffec003b4f41281eda190ea0df57 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Thu, 7 Nov 2024 16:01:08 -0800
Subject: [PATCH 11/42] Add separate methods for docx and pdf files to just
 convert files to raw text, before further processing

---
 .../processor/content/docx/docx_to_entries.py | 46 +++++++++------
 .../processor/content/pdf/pdf_to_entries.py   | 56 ++++++++++---------
 2 files changed, 59 insertions(+), 43 deletions(-)

diff --git a/src/khoj/processor/content/docx/docx_to_entries.py b/src/khoj/processor/content/docx/docx_to_entries.py
index 00ed3ca4..a2948caa 100644
--- a/src/khoj/processor/content/docx/docx_to_entries.py
+++ b/src/khoj/processor/content/docx/docx_to_entries.py
@@ -58,28 +58,13 @@ class DocxToEntries(TextToEntries):
         file_to_text_map = dict()
         for docx_file in docx_files:
             try:
-                timestamp_now = datetime.utcnow().timestamp()
-                tmp_file = f"tmp_docx_file_{timestamp_now}.docx"
-                with open(tmp_file, "wb") as f:
-                    bytes_content = docx_files[docx_file]
-                    f.write(bytes_content)
-
-                # Load the content using Docx2txtLoader
-                loader = Docx2txtLoader(tmp_file)
-                docx_entries_per_file = loader.load()
-
-                # Convert the loaded entries into the desired format
-                docx_texts = [page.page_content for page in docx_entries_per_file]
-
+                docx_texts = DocxToEntries.extract_text(docx_files[docx_file])
                 entry_to_location_map += zip(docx_texts, [docx_file] * len(docx_texts))
                 entries.extend(docx_texts)
                 file_to_text_map[docx_file] = docx_texts
             except Exception as e:
-                logger.warning(f"Unable to process file: {docx_file}. This file will not be indexed.")
+                logger.warning(f"Unable to extract entries from file: {docx_file}")
                 logger.warning(e, exc_info=True)
-            finally:
-                if os.path.exists(f"{tmp_file}"):
-                    os.remove(f"{tmp_file}")
         return file_to_text_map, DocxToEntries.convert_docx_entries_to_maps(entries, dict(entry_to_location_map))
 
     @staticmethod
@@ -103,3 +88,30 @@ class DocxToEntries(TextToEntries):
         logger.debug(f"Converted {len(parsed_entries)} DOCX entries to dictionaries")
 
         return entries
+
+    @staticmethod
+    def extract_text(docx_file):
+        """Extract text from specified DOCX file"""
+        try:
+            timestamp_now = datetime.utcnow().timestamp()
+            tmp_file = f"tmp_docx_file_{timestamp_now}.docx"
+            docx_entry_by_pages = []
+            with open(tmp_file, "wb") as f:
+                bytes_content = docx_file
+                f.write(bytes_content)
+
+            # Load the content using Docx2txtLoader
+            loader = Docx2txtLoader(tmp_file)
+            docx_entries_per_file = loader.load()
+
+            # Convert the loaded entries into the desired format
+            docx_entry_by_pages = [page.page_content for page in docx_entries_per_file]
+
+        except Exception as e:
+            logger.warning(f"Unable to extract text from file: {docx_file}")
+            logger.warning(e, exc_info=True)
+        finally:
+            if os.path.exists(f"{tmp_file}"):
+                os.remove(f"{tmp_file}")
+
+        return docx_entry_by_pages
diff --git a/src/khoj/processor/content/pdf/pdf_to_entries.py b/src/khoj/processor/content/pdf/pdf_to_entries.py
index 063d1e74..35aa203f 100644
--- a/src/khoj/processor/content/pdf/pdf_to_entries.py
+++ b/src/khoj/processor/content/pdf/pdf_to_entries.py
@@ -59,32 +59,9 @@ class PdfToEntries(TextToEntries):
         entries: List[str] = []
         entry_to_location_map: List[Tuple[str, str]] = []
         for pdf_file in pdf_files:
-            try:
-                # Write the PDF file to a temporary file, as it is stored in byte format in the pdf_file object and the PDF Loader expects a file path
-                timestamp_now = datetime.utcnow().timestamp()
-                tmp_file = f"tmp_pdf_file_{timestamp_now}.pdf"
-                with open(f"{tmp_file}", "wb") as f:
-                    bytes = pdf_files[pdf_file]
-                    f.write(bytes)
-                try:
-                    loader = PyMuPDFLoader(f"{tmp_file}", extract_images=False)
-                    pdf_entries_per_file = [page.page_content for page in loader.load()]
-                except ImportError:
-                    loader = PyMuPDFLoader(f"{tmp_file}")
-                    pdf_entries_per_file = [
-                        page.page_content for page in loader.load()
-                    ]  # page_content items list for a given pdf.
-                entry_to_location_map += zip(
-                    pdf_entries_per_file, [pdf_file] * len(pdf_entries_per_file)
-                )  # this is an indexed map of pdf_entries for the pdf.
-                entries.extend(pdf_entries_per_file)
-                file_to_text_map[pdf_file] = pdf_entries_per_file
-            except Exception as e:
-                logger.warning(f"Unable to process file: {pdf_file}. This file will not be indexed.")
-                logger.warning(e, exc_info=True)
-            finally:
-                if os.path.exists(f"{tmp_file}"):
-                    os.remove(f"{tmp_file}")
+            pdf_entries_per_file = PdfToEntries.extract_text(pdf_file)
+            entries.extend(pdf_entries_per_file)
+            file_to_text_map[pdf_file] = pdf_entries_per_file
 
         return file_to_text_map, PdfToEntries.convert_pdf_entries_to_maps(entries, dict(entry_to_location_map))
 
@@ -109,3 +86,30 @@ class PdfToEntries(TextToEntries):
         logger.debug(f"Converted {len(parsed_entries)} PDF entries to dictionaries")
 
         return entries
+
+    @staticmethod
+    def extract_text(pdf_file):
+        """Extract text from specified PDF files"""
+        try:
+            # Write the PDF file to a temporary file, as it is stored in byte format in the pdf_file object and the PDF Loader expects a file path
+            timestamp_now = datetime.utcnow().timestamp()
+            tmp_file = f"tmp_pdf_file_{timestamp_now}.pdf"
+            pdf_entry_by_pages = []
+            with open(f"{tmp_file}", "wb") as f:
+                f.write(pdf_file)
+            try:
+                loader = PyMuPDFLoader(f"{tmp_file}", extract_images=False)
+                pdf_entry_by_pages = [page.page_content for page in loader.load()]
+            except ImportError:
+                loader = PyMuPDFLoader(f"{tmp_file}")
+                pdf_entry_by_pages = [
+                    page.page_content for page in loader.load()
+                ]  # page_content items list for a given pdf.
+        except Exception as e:
+            logger.warning(f"Unable to process file: {pdf_file}. This file will not be indexed.")
+            logger.warning(e, exc_info=True)
+        finally:
+            if os.path.exists(f"{tmp_file}"):
+                os.remove(f"{tmp_file}")
+
+        return pdf_entry_by_pages

From b8ed98530f310bbb25433cca115d58d4f36b3e1b Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Thu, 7 Nov 2024 16:01:48 -0800
Subject: [PATCH 12/42] Accept attached files in the chat API

- weave through all subsequent subcalls to models, where relevant, and save to conversation log
---
 src/khoj/routers/api_chat.py | 26 +++++++++++++++++++++++---
 1 file changed, 23 insertions(+), 3 deletions(-)

diff --git a/src/khoj/routers/api_chat.py b/src/khoj/routers/api_chat.py
index a9a6f09f..cc69930e 100644
--- a/src/khoj/routers/api_chat.py
+++ b/src/khoj/routers/api_chat.py
@@ -45,7 +45,7 @@ from khoj.routers.helpers import (
     aget_relevant_output_modes,
     construct_automation_created_message,
     create_automation,
-    gather_attached_files,
+    gather_raw_attached_files,
     generate_excalidraw_diagram,
     generate_summary_from_files,
     get_conversation_command,
@@ -71,7 +71,12 @@ from khoj.utils.helpers import (
     get_device,
     is_none_or_empty,
 )
-from khoj.utils.rawconfig import FileFilterRequest, FilesFilterRequest, LocationData
+from khoj.utils.rawconfig import (
+    ChatRequestBody,
+    FileFilterRequest,
+    FilesFilterRequest,
+    LocationData,
+)
 
 # Initialize Router
 logger = logging.getLogger(__name__)
@@ -566,6 +571,7 @@ async def chat(
     country_code = body.country_code or get_country_code_from_timezone(body.timezone)
     timezone = body.timezone
     raw_images = body.images
+    raw_attached_files = body.files
 
     async def event_generator(q: str, images: list[str]):
         start_time = time.perf_counter()
@@ -577,6 +583,7 @@ async def chat(
         q = unquote(q)
         train_of_thought = []
         nonlocal conversation_id
+        nonlocal raw_attached_files
 
         tracer: dict = {
             "mid": turn_id,
@@ -596,6 +603,11 @@ async def chat(
                 if uploaded_image:
                     uploaded_images.append(uploaded_image)
 
+        attached_files: Dict[str, str] = {}
+        if raw_attached_files:
+            for file in raw_attached_files:
+                attached_files[file.name] = file.content
+
         async def send_event(event_type: ChatEvent, data: str | dict):
             nonlocal connection_alive, ttft, train_of_thought
             if not connection_alive or await request.is_disconnected():
@@ -707,7 +719,7 @@ async def chat(
         compiled_references: List[Any] = []
         inferred_queries: List[Any] = []
         file_filters = conversation.file_filters if conversation and conversation.file_filters else []
-        attached_file_context = await gather_attached_files(user, file_filters)
+        attached_file_context = gather_raw_attached_files(attached_files)
 
         if conversation_commands == [ConversationCommand.Default] or is_automated_task:
             conversation_commands = await aget_relevant_information_sources(
@@ -833,6 +845,7 @@ async def chat(
                 query_images=uploaded_images,
                 tracer=tracer,
                 train_of_thought=train_of_thought,
+                raw_attached_files=raw_attached_files,
             )
             return
 
@@ -878,6 +891,7 @@ async def chat(
                 query_images=uploaded_images,
                 tracer=tracer,
                 train_of_thought=train_of_thought,
+                raw_attached_files=raw_attached_files,
             )
             async for result in send_llm_response(llm_response):
                 yield result
@@ -900,6 +914,7 @@ async def chat(
                     query_images=uploaded_images,
                     agent=agent,
                     tracer=tracer,
+                    attached_files=attached_file_context,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
                         yield result[ChatEvent.STATUS]
@@ -1085,6 +1100,8 @@ async def chat(
                 query_images=uploaded_images,
                 tracer=tracer,
                 train_of_thought=train_of_thought,
+                attached_file_context=attached_file_context,
+                raw_attached_files=raw_attached_files,
             )
             content_obj = {
                 "intentType": intent_type,
@@ -1144,6 +1161,8 @@ async def chat(
                 query_images=uploaded_images,
                 tracer=tracer,
                 train_of_thought=train_of_thought,
+                attached_file_context=attached_file_context,
+                raw_attached_files=raw_attached_files,
             )
 
             async for result in send_llm_response(json.dumps(content_obj)):
@@ -1172,6 +1191,7 @@ async def chat(
             tracer,
             train_of_thought,
             attached_file_context,
+            raw_attached_files,
         )
 
         # Send Response

From 140c67f6b55ec1999f832f04957cfa232ef462e0 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Thu, 7 Nov 2024 16:02:02 -0800
Subject: [PATCH 13/42] Remove focus ring from the text area component

---
 src/interface/web/components/ui/textarea.tsx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/src/interface/web/components/ui/textarea.tsx b/src/interface/web/components/ui/textarea.tsx
index 68aefb3e..ce071877 100644
--- a/src/interface/web/components/ui/textarea.tsx
+++ b/src/interface/web/components/ui/textarea.tsx
@@ -9,7 +9,7 @@ const Textarea = React.forwardRef<HTMLTextAreaElement, TextareaProps>(
         return (
             <textarea
                 className={cn(
-                    "flex min-h-[80px] w-full rounded-md border border-input bg-background px-3 py-2 text-sm ring-offset-background placeholder:text-muted-foreground focus-visible:outline-none focus-visible:ring-2 focus-visible:ring-ring focus-visible:ring-offset-2 disabled:cursor-not-allowed disabled:opacity-50",
+                    "flex min-h-[80px] w-full rounded-md border border-input bg-background px-3 py-2 text-sm ring-offset-background placeholder:text-muted-foreground disabled:cursor-not-allowed disabled:opacity-50",
                     className,
                 )}
                 ref={ref}

From 92c3b9c5026be6b8ba20ce154647a33dd3170fc3 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Thu, 7 Nov 2024 16:02:53 -0800
Subject: [PATCH 14/42] Add function to get an icon from a file type

---
 src/interface/web/app/common/iconUtils.tsx | 8 ++++++++
 1 file changed, 8 insertions(+)

diff --git a/src/interface/web/app/common/iconUtils.tsx b/src/interface/web/app/common/iconUtils.tsx
index b6391d1b..4fad417e 100644
--- a/src/interface/web/app/common/iconUtils.tsx
+++ b/src/interface/web/app/common/iconUtils.tsx
@@ -49,6 +49,7 @@ import {
     Gavel,
     Broadcast,
     KeyReturn,
+    FilePdf,
 } from "@phosphor-icons/react";
 import { Markdown, OrgMode, Pdf, Word } from "@/app/components/logo/fileLogo";
 
@@ -216,6 +217,13 @@ export function getIconForSlashCommand(command: string, customClassName: string
     return <ArrowRight className={className} />;
 }
 
+export function getIconFromFileType(fileType: string) {
+    if (fileType == "pdf") {
+        return <FilePdf className="w-6 h-6 text-muted-foreground inline-flex mr-1" />;
+    }
+    return <File className="w-6 h-6 text-muted-foreground inline-flex mr-1" />;
+}
+
 function getIconFromIconName(
     iconName: string,
     color: string = "gray",

From e5218538954989cde9ea0c173c595d3f60e4eb4d Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Thu, 7 Nov 2024 16:03:31 -0800
Subject: [PATCH 15/42] Remove unnecessary console.log statements

---
 src/interface/web/app/settings/page.tsx | 7 -------
 1 file changed, 7 deletions(-)

diff --git a/src/interface/web/app/settings/page.tsx b/src/interface/web/app/settings/page.tsx
index fe3e11e7..bab7df32 100644
--- a/src/interface/web/app/settings/page.tsx
+++ b/src/interface/web/app/settings/page.tsx
@@ -137,10 +137,8 @@ const ManageFilesModal: React.FC<{ onClose: () => void }> = ({ onClose }) => {
 
     const deleteSelected = async () => {
         let filesToDelete = selectedFiles.length > 0 ? selectedFiles : filteredFiles;
-        console.log("Delete selected files", filesToDelete);
 
         if (filesToDelete.length === 0) {
-            console.log("No files to delete");
             return;
         }
 
@@ -162,15 +160,12 @@ const ManageFilesModal: React.FC<{ onClose: () => void }> = ({ onClose }) => {
 
             // Reset selectedFiles
             setSelectedFiles([]);
-
-            console.log("Deleted files:", filesToDelete);
         } catch (error) {
             console.error("Error deleting files:", error);
         }
     };
 
     const deleteFile = async (filename: string) => {
-        console.log("Delete selected file", filename);
         try {
             const response = await fetch(
                 `/api/content/file?filename=${encodeURIComponent(filename)}`,
@@ -189,8 +184,6 @@ const ManageFilesModal: React.FC<{ onClose: () => void }> = ({ onClose }) => {
 
             // Remove the file from selectedFiles if it's there
             setSelectedFiles((prevSelected) => prevSelected.filter((file) => file !== filename));
-
-            console.log("Deleted file:", filename);
         } catch (error) {
             console.error("Error deleting file:", error);
         }

From a89160e2f792ecd2a223771ab634daa0966940d7 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Thu, 7 Nov 2024 16:06:37 -0800
Subject: [PATCH 16/42] Add support for converting an attached doc and chatting
 with it

- Document is first converted in the chatinputarea, then sent to the chat component. From there, it's sent in the chat API body and then processed by the backend
- We couldn't directly use a UploadFile type in the backend API because we'd have to convert the api type to a multipart form. This would require other client side migrations without uniform benefit, which is why we do it in this two-phase process. This also gives us capacity to repurpose the moe generic interface down the road.
---
 src/interface/web/app/chat/page.tsx           |  29 +++-
 src/interface/web/app/common/chatFunctions.ts |  52 ++++++
 src/interface/web/app/common/utils.ts         |  10 ++
 .../chatInputArea/chatInputArea.tsx           | 161 ++++++++++++++----
 src/interface/web/app/page.tsx                |  32 ++--
 5 files changed, 226 insertions(+), 58 deletions(-)

diff --git a/src/interface/web/app/chat/page.tsx b/src/interface/web/app/chat/page.tsx
index c3d5ff37..c0472b23 100644
--- a/src/interface/web/app/chat/page.tsx
+++ b/src/interface/web/app/chat/page.tsx
@@ -19,7 +19,11 @@ import {
     StreamMessage,
 } from "../components/chatMessage/chatMessage";
 import { useIPLocationData, useIsMobileWidth, welcomeConsole } from "../common/utils";
-import { ChatInputArea, ChatOptions } from "../components/chatInputArea/chatInputArea";
+import {
+    AttachedFileText,
+    ChatInputArea,
+    ChatOptions,
+} from "../components/chatInputArea/chatInputArea";
 import { useAuthenticatedData } from "../common/auth";
 import { AgentData } from "../agents/page";
 
@@ -30,7 +34,7 @@ interface ChatBodyDataProps {
     setQueryToProcess: (query: string) => void;
     streamedMessages: StreamMessage[];
     setStreamedMessages: (messages: StreamMessage[]) => void;
-    setUploadedFiles: (files: string[]) => void;
+    setUploadedFiles: (files: AttachedFileText[] | undefined) => void;
     isMobileWidth?: boolean;
     isLoggedIn: boolean;
     setImages: (images: string[]) => void;
@@ -77,6 +81,20 @@ function ChatBodyData(props: ChatBodyDataProps) {
                 setIsInResearchMode(true);
             }
         }
+
+        const storedUploadedFiles = localStorage.getItem("uploadedFiles");
+        const parsedFiles = storedUploadedFiles ? JSON.parse(storedUploadedFiles) : [];
+
+        const uploadedFiles: AttachedFileText[] = [];
+        for (const file of parsedFiles) {
+            uploadedFiles.push({
+                name: file.name,
+                file_type: file.file_type,
+                content: file.content,
+                size: file.size,
+            });
+        }
+        props.setUploadedFiles(uploadedFiles);
     }, [setQueryToProcess, props.setImages]);
 
     useEffect(() => {
@@ -100,6 +118,7 @@ function ChatBodyData(props: ChatBodyDataProps) {
         ) {
             setProcessingMessage(false);
             setImages([]); // Reset images after processing
+            props.setUploadedFiles(undefined); // Reset uploaded files after processing
         } else {
             setMessage("");
         }
@@ -153,7 +172,7 @@ export default function Chat() {
     const [messages, setMessages] = useState<StreamMessage[]>([]);
     const [queryToProcess, setQueryToProcess] = useState<string>("");
     const [processQuerySignal, setProcessQuerySignal] = useState(false);
-    const [uploadedFiles, setUploadedFiles] = useState<string[]>([]);
+    const [uploadedFiles, setUploadedFiles] = useState<AttachedFileText[] | undefined>(undefined);
     const [images, setImages] = useState<string[]>([]);
 
     const locationData = useIPLocationData() || {
@@ -192,6 +211,7 @@ export default function Chat() {
                 timestamp: new Date().toISOString(),
                 rawQuery: queryToProcess || "",
                 images: images,
+                attachedFiles: uploadedFiles,
             };
             setMessages((prevMessages) => [...prevMessages, newStreamMessage]);
             setProcessQuerySignal(true);
@@ -273,6 +293,7 @@ export default function Chat() {
                 timezone: locationData.timezone,
             }),
             ...(images.length > 0 && { images: images }),
+            ...(uploadedFiles && { files: uploadedFiles }),
         };
 
         const response = await fetch(chatAPI, {
@@ -325,7 +346,7 @@ export default function Chat() {
             <div>
                 <SidePanel
                     conversationId={conversationId}
-                    uploadedFiles={uploadedFiles}
+                    uploadedFiles={[]}
                     isMobileWidth={isMobileWidth}
                 />
             </div>
diff --git a/src/interface/web/app/common/chatFunctions.ts b/src/interface/web/app/common/chatFunctions.ts
index a42dde40..3aff7596 100644
--- a/src/interface/web/app/common/chatFunctions.ts
+++ b/src/interface/web/app/common/chatFunctions.ts
@@ -267,6 +267,58 @@ export async function createNewConversation(slug: string) {
     }
 }
 
+export async function packageFilesForUpload(files: FileList): Promise<FormData> {
+    const formData = new FormData();
+
+    const fileReadPromises = Array.from(files).map((file) => {
+        return new Promise<void>((resolve, reject) => {
+            let reader = new FileReader();
+            reader.onload = function (event) {
+                if (event.target === null) {
+                    reject();
+                    return;
+                }
+
+                let fileContents = event.target.result;
+                let fileType = file.type;
+                let fileName = file.name;
+                if (fileType === "") {
+                    let fileExtension = fileName.split(".").pop();
+                    if (fileExtension === "org") {
+                        fileType = "text/org";
+                    } else if (fileExtension === "md") {
+                        fileType = "text/markdown";
+                    } else if (fileExtension === "txt") {
+                        fileType = "text/plain";
+                    } else if (fileExtension === "html") {
+                        fileType = "text/html";
+                    } else if (fileExtension === "pdf") {
+                        fileType = "application/pdf";
+                    } else {
+                        // Skip this file if its type is not supported
+                        resolve();
+                        return;
+                    }
+                }
+
+                if (fileContents === null) {
+                    reject();
+                    return;
+                }
+
+                let fileObj = new Blob([fileContents], { type: fileType });
+                formData.append("files", fileObj, file.name);
+                resolve();
+            };
+            reader.onerror = reject;
+            reader.readAsArrayBuffer(file);
+        });
+    });
+
+    await Promise.all(fileReadPromises);
+    return formData;
+}
+
 export function uploadDataForIndexing(
     files: FileList,
     setWarning: (warning: string) => void,
diff --git a/src/interface/web/app/common/utils.ts b/src/interface/web/app/common/utils.ts
index 6c10ba8a..efa2c1d3 100644
--- a/src/interface/web/app/common/utils.ts
+++ b/src/interface/web/app/common/utils.ts
@@ -71,6 +71,16 @@ export function useIsMobileWidth() {
     return isMobileWidth;
 }
 
+export const convertBytesToText = (fileSize: number) => {
+    if (fileSize < 1024) {
+        return `${fileSize} B`;
+    } else if (fileSize < 1024 * 1024) {
+        return `${(fileSize / 1024).toFixed(2)} KB`;
+    } else {
+        return `${(fileSize / (1024 * 1024)).toFixed(2)} MB`;
+    }
+};
+
 export function useDebounce<T>(value: T, delay: number): T {
     const [debouncedValue, setDebouncedValue] = useState<T>(value);
 
diff --git a/src/interface/web/app/components/chatInputArea/chatInputArea.tsx b/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
index 9f8f8c18..e2e3fd07 100644
--- a/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
+++ b/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
@@ -40,19 +40,27 @@ import { Tooltip, TooltipContent, TooltipProvider, TooltipTrigger } from "@/comp
 import { convertColorToTextClass, convertToBGClass } from "@/app/common/colorUtils";
 
 import LoginPrompt from "../loginPrompt/loginPrompt";
-import { uploadDataForIndexing } from "../../common/chatFunctions";
 import { InlineLoading } from "../loading/loading";
-import { getIconForSlashCommand } from "@/app/common/iconUtils";
+import { getIconForSlashCommand, getIconFromFileType } from "@/app/common/iconUtils";
+import { packageFilesForUpload } from "@/app/common/chatFunctions";
+import { convertBytesToText } from "@/app/common/utils";
 
 export interface ChatOptions {
     [key: string]: string;
 }
 
+export interface AttachedFileText {
+    name: string;
+    content: string;
+    file_type: string;
+    size: number;
+}
+
 interface ChatInputProps {
     sendMessage: (message: string) => void;
     sendImage: (image: string) => void;
     sendDisabled: boolean;
-    setUploadedFiles?: (files: string[]) => void;
+    setUploadedFiles: (files: AttachedFileText[]) => void;
     conversationId?: string | null;
     chatOptionsData?: ChatOptions | null;
     isMobileWidth?: boolean;
@@ -75,6 +83,9 @@ export const ChatInputArea = forwardRef<HTMLTextAreaElement, ChatInputProps>((pr
     const [imagePaths, setImagePaths] = useState<string[]>([]);
     const [imageData, setImageData] = useState<string[]>([]);
 
+    const [attachedFiles, setAttachedFiles] = useState<FileList | null>(null);
+    const [convertedAttachedFiles, setConvertedAttachedFiles] = useState<AttachedFileText[]>([]);
+
     const [recording, setRecording] = useState(false);
     const [mediaRecorder, setMediaRecorder] = useState<MediaRecorder | null>(null);
 
@@ -154,6 +165,8 @@ export const ChatInputArea = forwardRef<HTMLTextAreaElement, ChatInputProps>((pr
         }
 
         props.sendMessage(messageToSend);
+        setAttachedFiles(null);
+        setConvertedAttachedFiles([]);
         setMessage("");
     }
 
@@ -203,22 +216,57 @@ export const ChatInputArea = forwardRef<HTMLTextAreaElement, ChatInputProps>((pr
             setImagePaths((prevPaths) => [...prevPaths, ...newImagePaths]);
             // Set focus to the input for user message after uploading files
             chatInputRef?.current?.focus();
-            return;
         }
 
-        uploadDataForIndexing(
-            files,
-            setWarning,
-            setUploading,
-            setError,
-            props.setUploadedFiles,
-            props.conversationId,
+        // Process all non-image files
+        const nonImageFiles = Array.from(files).filter(
+            (file) => !image_endings.includes(file.name.split(".").pop() || ""),
         );
 
+        // Concatenate attachedFiles and files
+        const newFiles = nonImageFiles
+            ? Array.from(nonImageFiles).concat(Array.from(attachedFiles || []))
+            : Array.from(attachedFiles || []);
+
+        const dataTransfer = new DataTransfer();
+        newFiles.forEach((file) => dataTransfer.items.add(file));
+        setAttachedFiles(dataTransfer.files);
+
+        // Extract text from files
+        extractTextFromFiles(dataTransfer.files).then((data) => {
+            props.setUploadedFiles(data);
+            setConvertedAttachedFiles(data);
+        });
+
+        const totalSize = Array.from(files).reduce((acc, file) => acc + file.size, 0);
+        const totalSizeInMB = totalSize / (1024 * 1024);
+
         // Set focus to the input for user message after uploading files
         chatInputRef?.current?.focus();
     }
 
+    async function extractTextFromFiles(files: FileList): Promise<AttachedFileText[]> {
+        const formData = await packageFilesForUpload(files);
+        setUploading(true);
+
+        try {
+            const response = await fetch("/api/content/convert", {
+                method: "POST",
+                body: formData,
+            });
+            setUploading(false);
+
+            if (!response.ok) {
+                throw new Error(`HTTP error! status: ${response.status}`);
+            }
+
+            return await response.json();
+        } catch (error) {
+            console.error("Error converting files:", error);
+            return [];
+        }
+    }
+
     // Assuming this function is added within the same context as the provided excerpt
     async function startRecordingAndTranscribe() {
         try {
@@ -445,6 +493,73 @@ export const ChatInputArea = forwardRef<HTMLTextAreaElement, ChatInputProps>((pr
                 </div>
             )}
             <div>
+                <div className="flex items-center gap-2 overflow-x-auto">
+                    {imageUploaded &&
+                        imagePaths.map((path, index) => (
+                            <div key={index} className="relative flex-shrink-0 pb-3 pt-2 group">
+                                <img
+                                    src={path}
+                                    alt={`img-${index}`}
+                                    className="w-auto h-16 object-cover rounded-xl"
+                                />
+                                <Button
+                                    variant="ghost"
+                                    size="icon"
+                                    className="absolute -top-0 -right-2 h-5 w-5 rounded-full bg-neutral-200 dark:bg-neutral-600 hover:bg-neutral-300 dark:hover:bg-neutral-500 opacity-0 group-hover:opacity-100 transition-opacity"
+                                    onClick={() => removeImageUpload(index)}
+                                >
+                                    <X className="h-3 w-3" />
+                                </Button>
+                            </div>
+                        ))}
+                    {convertedAttachedFiles &&
+                        Array.from(convertedAttachedFiles).map((file, index) => (
+                            <div key={index} className="relative flex-shrink-0 p-2 group">
+                                <div
+                                    className={`w-auto h-16 object-cover rounded-xl ${props.agentColor ? convertToBGClass(props.agentColor) : "bg-orange-300 hover:bg-orange-500"} bg-opacity-15`}
+                                >
+                                    <div className="flex p-2 flex-col justify-start items-start h-full">
+                                        <span className="text-sm font-bold text-neutral-500 dark:text-neutral-400 text-ellipsis truncate max-w-[200px] break-words">
+                                            {file.name}
+                                        </span>
+                                        <span className="flex items-center gap-1">
+                                            {getIconFromFileType(file.file_type)}
+                                            <span className="text-xs text-neutral-500 dark:text-neutral-400">
+                                                {convertBytesToText(file.size)}
+                                            </span>
+                                        </span>
+                                    </div>
+                                </div>
+                                <Button
+                                    variant="ghost"
+                                    size="icon"
+                                    className="absolute -top-0 -right-2 h-5 w-5 rounded-full bg-neutral-200 dark:bg-neutral-600 hover:bg-neutral-300 dark:hover:bg-neutral-500 opacity-0 group-hover:opacity-100 transition-opacity"
+                                    onClick={() => {
+                                        setAttachedFiles((prevFiles) => {
+                                            const removeFile = file.name;
+                                            if (!prevFiles) return null;
+                                            const updatedFiles = Array.from(prevFiles).filter(
+                                                (file) => file.name !== removeFile,
+                                            );
+                                            const dataTransfer = new DataTransfer();
+                                            updatedFiles.forEach((file) =>
+                                                dataTransfer.items.add(file),
+                                            );
+                                            extractTextFromFiles(dataTransfer.files).then(
+                                                (data) => {
+                                                    props.setUploadedFiles(data);
+                                                    setConvertedAttachedFiles(data);
+                                                },
+                                            );
+                                            return dataTransfer.files;
+                                        });
+                                    }}
+                                >
+                                    <X className="h-3 w-3" />
+                                </Button>
+                            </div>
+                        ))}
+                </div>
                 <div
                     className={`${styles.actualInputArea} justify-between dark:bg-neutral-700 relative ${isDragAndDropping && "animate-pulse"}`}
                     onDragOver={handleDragOver}
@@ -458,6 +573,7 @@ export const ChatInputArea = forwardRef<HTMLTextAreaElement, ChatInputProps>((pr
                         onChange={handleFileChange}
                         style={{ display: "none" }}
                     />
+
                     <div className="flex items-center">
                         <Button
                             variant={"ghost"}
@@ -469,29 +585,6 @@ export const ChatInputArea = forwardRef<HTMLTextAreaElement, ChatInputProps>((pr
                         </Button>
                     </div>
                     <div className="flex-grow flex flex-col w-full gap-1.5 relative">
-                        <div className="flex items-center gap-2 overflow-x-auto">
-                            {imageUploaded &&
-                                imagePaths.map((path, index) => (
-                                    <div
-                                        key={index}
-                                        className="relative flex-shrink-0 pb-3 pt-2 group"
-                                    >
-                                        <img
-                                            src={path}
-                                            alt={`img-${index}`}
-                                            className="w-auto h-16 object-cover rounded-xl"
-                                        />
-                                        <Button
-                                            variant="ghost"
-                                            size="icon"
-                                            className="absolute -top-0 -right-2 h-5 w-5 rounded-full bg-neutral-200 dark:bg-neutral-600 hover:bg-neutral-300 dark:hover:bg-neutral-500 opacity-0 group-hover:opacity-100 transition-opacity"
-                                            onClick={() => removeImageUpload(index)}
-                                        >
-                                            <X className="h-3 w-3" />
-                                        </Button>
-                                    </div>
-                                ))}
-                        </div>
                         <Textarea
                             ref={chatInputRef}
                             className={`border-none focus:border-none
diff --git a/src/interface/web/app/page.tsx b/src/interface/web/app/page.tsx
index 1b714414..98d3a47e 100644
--- a/src/interface/web/app/page.tsx
+++ b/src/interface/web/app/page.tsx
@@ -11,7 +11,11 @@ import { Card, CardTitle } from "@/components/ui/card";
 import SuggestionCard from "@/app/components/suggestions/suggestionCard";
 import SidePanel from "@/app/components/sidePanel/chatHistorySidePanel";
 import Loading from "@/app/components/loading/loading";
-import { ChatInputArea, ChatOptions } from "@/app/components/chatInputArea/chatInputArea";
+import {
+    AttachedFileText,
+    ChatInputArea,
+    ChatOptions,
+} from "@/app/components/chatInputArea/chatInputArea";
 import { Suggestion, suggestionsData } from "@/app/components/suggestions/suggestionsData";
 import LoginPrompt from "@/app/components/loginPrompt/loginPrompt";
 
@@ -30,12 +34,11 @@ import { useRouter, useSearchParams } from "next/navigation";
 import { ScrollArea, ScrollBar } from "@/components/ui/scroll-area";
 import { AgentCard } from "@/app/components/agentCard/agentCard";
 import { Popover, PopoverContent, PopoverTrigger } from "@/components/ui/popover";
-import { modifyFileFilterForConversation } from "./common/chatFunctions";
 
 interface ChatBodyDataProps {
     chatOptionsData: ChatOptions | null;
     onConversationIdChange?: (conversationId: string) => void;
-    setUploadedFiles: (files: string[]) => void;
+    setUploadedFiles: (files: AttachedFileText[]) => void;
     isMobileWidth?: boolean;
     isLoggedIn: boolean;
     userConfig: UserConfig | null;
@@ -151,26 +154,13 @@ function ChatBodyData(props: ChatBodyDataProps) {
                 setProcessingMessage(true);
                 try {
                     const newConversationId = await createNewConversation(selectedAgent || "khoj");
-                    const uploadedFiles = localStorage.getItem("uploadedFiles");
                     onConversationIdChange?.(newConversationId);
                     localStorage.setItem("message", message);
                     if (images.length > 0) {
                         localStorage.setItem("images", JSON.stringify(images));
                     }
 
-                    if (uploadedFiles) {
-                        modifyFileFilterForConversation(
-                            newConversationId,
-                            JSON.parse(uploadedFiles),
-                            () => {
-                                window.location.href = `/chat?conversationId=${newConversationId}`;
-                            },
-                            "add",
-                        );
-                        localStorage.removeItem("uploadedFiles");
-                    } else {
-                        window.location.href = `/chat?conversationId=${newConversationId}`;
-                    }
+                    window.location.href = `/chat?conversationId=${newConversationId}`;
                 } catch (error) {
                     console.error("Error creating new conversation:", error);
                     setProcessingMessage(false);
@@ -416,7 +406,7 @@ export default function Home() {
     const [chatOptionsData, setChatOptionsData] = useState<ChatOptions | null>(null);
     const [isLoading, setLoading] = useState(true);
     const [conversationId, setConversationID] = useState<string | null>(null);
-    const [uploadedFiles, setUploadedFiles] = useState<string[]>([]);
+    const [uploadedFiles, setUploadedFiles] = useState<AttachedFileText[] | null>(null);
     const isMobileWidth = useIsMobileWidth();
 
     const { userConfig: initialUserConfig, isLoadingUserConfig } = useUserConfig(true);
@@ -433,7 +423,9 @@ export default function Home() {
     }, [initialUserConfig]);
 
     useEffect(() => {
-        localStorage.setItem("uploadedFiles", JSON.stringify(uploadedFiles));
+        if (uploadedFiles) {
+            localStorage.setItem("uploadedFiles", JSON.stringify(uploadedFiles));
+        }
     }, [uploadedFiles]);
 
     useEffect(() => {
@@ -461,7 +453,7 @@ export default function Home() {
             <div className={`${styles.sidePanel}`}>
                 <SidePanel
                     conversationId={conversationId}
-                    uploadedFiles={uploadedFiles}
+                    uploadedFiles={[]}
                     isMobileWidth={isMobileWidth}
                 />
             </div>

From 3a51996f649fcaf22aeb23dc43881a6ea7773219 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Thu, 7 Nov 2024 16:06:58 -0800
Subject: [PATCH 17/42] Process attached files in the chat history and add them
 to the chat message

---
 .../components/chatHistory/chatHistory.tsx    |  1 +
 .../components/chatMessage/chatMessage.tsx    | 42 ++++++++++++++++++-
 2 files changed, 42 insertions(+), 1 deletion(-)

diff --git a/src/interface/web/app/components/chatHistory/chatHistory.tsx b/src/interface/web/app/components/chatHistory/chatHistory.tsx
index 772f1d35..37b44f3a 100644
--- a/src/interface/web/app/components/chatHistory/chatHistory.tsx
+++ b/src/interface/web/app/components/chatHistory/chatHistory.tsx
@@ -373,6 +373,7 @@ export default function ChatHistory(props: ChatHistoryProps) {
                                             images: message.images,
                                             conversationId: props.conversationId,
                                             turnId: messageTurnId,
+                                            attachedFiles: message.attachedFiles,
                                         }}
                                         customClassName="fullHistory"
                                         borderLeftColor={`${data?.agent?.color}-500`}
diff --git a/src/interface/web/app/components/chatMessage/chatMessage.tsx b/src/interface/web/app/components/chatMessage/chatMessage.tsx
index d05d9829..9f9cff12 100644
--- a/src/interface/web/app/components/chatMessage/chatMessage.tsx
+++ b/src/interface/web/app/components/chatMessage/chatMessage.tsx
@@ -40,6 +40,18 @@ import { AgentData } from "@/app/agents/page";
 import renderMathInElement from "katex/contrib/auto-render";
 import "katex/dist/katex.min.css";
 import ExcalidrawComponent from "../excalidraw/excalidraw";
+import { AttachedFileText } from "../chatInputArea/chatInputArea";
+import {
+    Dialog,
+    DialogContent,
+    DialogDescription,
+    DialogHeader,
+    DialogTrigger,
+} from "@/components/ui/dialog";
+import { DialogTitle } from "@radix-ui/react-dialog";
+import { convertBytesToText } from "@/app/common/utils";
+import { ScrollArea } from "@/components/ui/scroll-area";
+import { getIconFromFileType } from "@/app/common/iconUtils";
 
 const md = new markdownIt({
     html: true,
@@ -149,6 +161,7 @@ export interface SingleChatMessage {
     images?: string[];
     conversationId: string;
     turnId?: string;
+    attachedFiles?: AttachedFileText[];
 }
 
 export interface StreamMessage {
@@ -165,6 +178,7 @@ export interface StreamMessage {
     intentType?: string;
     inferredQueries?: string[];
     turnId?: string;
+    attachedFiles?: AttachedFileText[];
 }
 
 export interface ChatHistoryData {
@@ -398,7 +412,6 @@ const ChatMessage = forwardRef<HTMLDivElement, ChatMessageProps>((props, ref) =>
         if (props.chatMessage.intent) {
             const { type, "inferred-queries": inferredQueries } = props.chatMessage.intent;
 
-            console.log("intent type", type);
             if (type in intentTypeHandlers) {
                 message = intentTypeHandlers[type as keyof typeof intentTypeHandlers](message);
             }
@@ -695,6 +708,33 @@ const ChatMessage = forwardRef<HTMLDivElement, ChatMessageProps>((props, ref) =>
             onMouseLeave={(event) => setIsHovering(false)}
             onMouseEnter={(event) => setIsHovering(true)}
         >
+            {props.chatMessage.attachedFiles && props.chatMessage.attachedFiles.length > 0 && (
+                <div className="flex flex-wrap flex-col m-2">
+                    {props.chatMessage.attachedFiles.map((file, index) => (
+                        <Dialog key={index}>
+                            <DialogTrigger>
+                                <div className="flex items-center space-x-2 cursor-pointer bg-gray-500 bg-opacity-25 rounded-lg m-1 p-2 w-full">
+                                    {getIconFromFileType(file.file_type)}
+                                    <span className="truncate">{file.name}</span>
+                                    {file.size && (
+                                        <span className="text-gray-400">
+                                            ({convertBytesToText(file.size)})
+                                        </span>
+                                    )}
+                                </div>
+                            </DialogTrigger>
+                            <DialogContent>
+                                <DialogHeader>
+                                    <DialogTitle>{file.name}</DialogTitle>
+                                </DialogHeader>
+                                <DialogDescription>
+                                    <ScrollArea className="max-h-96">{file.content}</ScrollArea>
+                                </DialogDescription>
+                            </DialogContent>
+                        </Dialog>
+                    ))}
+                </div>
+            )}
             <div className={chatMessageWrapperClasses(props.chatMessage)}>
                 <div
                     ref={messageRef}

From 9bbe27fe36c853d72bcb3ee2bc9356e67c705627 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Thu, 7 Nov 2024 17:12:45 -0800
Subject: [PATCH 18/42] Set default value of attached files to empty list

---
 src/khoj/utils/rawconfig.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/src/khoj/utils/rawconfig.py b/src/khoj/utils/rawconfig.py
index 2c956c2c..9a7a75a8 100644
--- a/src/khoj/utils/rawconfig.py
+++ b/src/khoj/utils/rawconfig.py
@@ -166,7 +166,7 @@ class ChatRequestBody(BaseModel):
     country_code: Optional[str] = None
     timezone: Optional[str] = None
     images: Optional[list[str]] = None
-    files: Optional[list[FileAttachment]] = None
+    files: Optional[list[FileAttachment]] = []
     create_new: Optional[bool] = False
 
 

From 4b8be55958445db0094f5ebb490d9cdb63790445 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Thu, 7 Nov 2024 17:13:04 -0800
Subject: [PATCH 19/42] Convert UUID to string when forking a conversation

---
 src/khoj/routers/api_chat.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/src/khoj/routers/api_chat.py b/src/khoj/routers/api_chat.py
index cc69930e..8397eacd 100644
--- a/src/khoj/routers/api_chat.py
+++ b/src/khoj/routers/api_chat.py
@@ -374,7 +374,7 @@ def fork_public_conversation(
             {
                 "status": "ok",
                 "next_url": redirect_uri,
-                "conversation_id": new_conversation.id,
+                "conversation_id": str(new_conversation.id),
             }
         ),
     )

From 33498d876b0d590dacaa1735fb29974df8abb948 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Thu, 7 Nov 2024 17:14:11 -0800
Subject: [PATCH 20/42] Simplify the share chat page. Don't need it to maintain
 its own conversation history

- When chatting on a shared page, fork and redirect to a new conversation page
---
 src/interface/web/app/chat/page.tsx       |   2 +-
 src/interface/web/app/share/chat/page.tsx | 145 +++-------------------
 2 files changed, 21 insertions(+), 126 deletions(-)

diff --git a/src/interface/web/app/chat/page.tsx b/src/interface/web/app/chat/page.tsx
index c0472b23..d6236499 100644
--- a/src/interface/web/app/chat/page.tsx
+++ b/src/interface/web/app/chat/page.tsx
@@ -95,7 +95,7 @@ function ChatBodyData(props: ChatBodyDataProps) {
             });
         }
         props.setUploadedFiles(uploadedFiles);
-    }, [setQueryToProcess, props.setImages]);
+    }, [setQueryToProcess, props.setImages, conversationId]);
 
     useEffect(() => {
         if (message) {
diff --git a/src/interface/web/app/share/chat/page.tsx b/src/interface/web/app/share/chat/page.tsx
index a7e66940..2a956083 100644
--- a/src/interface/web/app/share/chat/page.tsx
+++ b/src/interface/web/app/share/chat/page.tsx
@@ -5,23 +5,25 @@ import React, { Suspense, useEffect, useRef, useState } from "react";
 
 import SidePanel from "../../components/sidePanel/chatHistorySidePanel";
 import ChatHistory from "../../components/chatHistory/chatHistory";
-import NavMenu from "../../components/navMenu/navMenu";
 import Loading from "../../components/loading/loading";
 
 import "katex/dist/katex.min.css";
 
-import { useIPLocationData, useIsMobileWidth, welcomeConsole } from "../../common/utils";
+import { useIsMobileWidth, welcomeConsole } from "../../common/utils";
 import { useAuthenticatedData } from "@/app/common/auth";
 
-import { ChatInputArea, ChatOptions } from "@/app/components/chatInputArea/chatInputArea";
+import {
+    AttachedFileText,
+    ChatInputArea,
+    ChatOptions,
+} from "@/app/components/chatInputArea/chatInputArea";
 import { StreamMessage } from "@/app/components/chatMessage/chatMessage";
-import { processMessageChunk } from "@/app/common/chatFunctions";
 import { AgentData } from "@/app/agents/page";
 
 interface ChatBodyDataProps {
     chatOptionsData: ChatOptions | null;
     setTitle: (title: string) => void;
-    setUploadedFiles: (files: string[]) => void;
+    setUploadedFiles: (files: AttachedFileText[]) => void;
     isMobileWidth?: boolean;
     publicConversationSlug: string;
     streamedMessages: StreamMessage[];
@@ -50,23 +52,6 @@ function ChatBodyData(props: ChatBodyDataProps) {
         }
     }, [images, props.setImages]);
 
-    useEffect(() => {
-        const storedImages = localStorage.getItem("images");
-        if (storedImages) {
-            const parsedImages: string[] = JSON.parse(storedImages);
-            setImages(parsedImages);
-            const encodedImages = parsedImages.map((img: string) => encodeURIComponent(img));
-            props.setImages(encodedImages);
-            localStorage.removeItem("images");
-        }
-
-        const storedMessage = localStorage.getItem("message");
-        if (storedMessage) {
-            setProcessingMessage(true);
-            setQueryToProcess(storedMessage);
-        }
-    }, [setQueryToProcess, props.setImages]);
-
     useEffect(() => {
         if (message) {
             setProcessingMessage(true);
@@ -130,14 +115,10 @@ export default function SharedChat() {
     const [conversationId, setConversationID] = useState<string | undefined>(undefined);
     const [messages, setMessages] = useState<StreamMessage[]>([]);
     const [queryToProcess, setQueryToProcess] = useState<string>("");
-    const [processQuerySignal, setProcessQuerySignal] = useState(false);
-    const [uploadedFiles, setUploadedFiles] = useState<string[]>([]);
+    const [uploadedFiles, setUploadedFiles] = useState<AttachedFileText[] | null>(null);
     const [paramSlug, setParamSlug] = useState<string | undefined>(undefined);
     const [images, setImages] = useState<string[]>([]);
 
-    const locationData = useIPLocationData() || {
-        timezone: Intl.DateTimeFormat().resolvedOptions().timeZone,
-    };
     const authenticatedData = useAuthenticatedData();
     const isMobileWidth = useIsMobileWidth();
 
@@ -161,6 +142,12 @@ export default function SharedChat() {
         setParamSlug(window.location.pathname.split("/").pop() || "");
     }, []);
 
+    useEffect(() => {
+        if (uploadedFiles) {
+            localStorage.setItem("uploadedFiles", JSON.stringify(uploadedFiles));
+        }
+    }, [uploadedFiles]);
+
     useEffect(() => {
         if (queryToProcess && !conversationId) {
             // If the user has not yet started conversing in the chat, create a new conversation
@@ -173,6 +160,11 @@ export default function SharedChat() {
                 .then((response) => response.json())
                 .then((data) => {
                     setConversationID(data.conversation_id);
+                    localStorage.setItem("message", queryToProcess);
+                    if (images.length > 0) {
+                        localStorage.setItem("images", JSON.stringify(images));
+                    }
+                    window.location.href = `/chat?conversationId=${data.conversation_id}`;
                 })
                 .catch((err) => {
                     console.error(err);
@@ -180,105 +172,8 @@ export default function SharedChat() {
                 });
             return;
         }
-
-        if (queryToProcess) {
-            // Add a new object to the state
-            const newStreamMessage: StreamMessage = {
-                rawResponse: "",
-                trainOfThought: [],
-                context: [],
-                onlineContext: {},
-                codeContext: {},
-                completed: false,
-                timestamp: new Date().toISOString(),
-                rawQuery: queryToProcess || "",
-                images: images,
-            };
-            setMessages((prevMessages) => [...prevMessages, newStreamMessage]);
-            setProcessQuerySignal(true);
-        }
     }, [queryToProcess, conversationId, paramSlug]);
 
-    useEffect(() => {
-        if (processQuerySignal) {
-            chat();
-        }
-    }, [processQuerySignal]);
-
-    async function readChatStream(response: Response) {
-        if (!response.ok) throw new Error(response.statusText);
-        if (!response.body) throw new Error("Response body is null");
-
-        const reader = response.body.getReader();
-        const decoder = new TextDecoder();
-        const eventDelimiter = "␃🔚␗";
-        let buffer = "";
-
-        while (true) {
-            const { done, value } = await reader.read();
-            if (done) {
-                setQueryToProcess("");
-                setProcessQuerySignal(false);
-                setImages([]);
-                break;
-            }
-
-            const chunk = decoder.decode(value, { stream: true });
-
-            buffer += chunk;
-
-            let newEventIndex;
-            while ((newEventIndex = buffer.indexOf(eventDelimiter)) !== -1) {
-                const event = buffer.slice(0, newEventIndex);
-                buffer = buffer.slice(newEventIndex + eventDelimiter.length);
-                if (event) {
-                    const currentMessage = messages.find((message) => !message.completed);
-
-                    if (!currentMessage) {
-                        console.error("No current message found");
-                        return;
-                    }
-
-                    processMessageChunk(event, currentMessage);
-
-                    setMessages([...messages]);
-                }
-            }
-        }
-    }
-
-    async function chat() {
-        if (!queryToProcess || !conversationId) return;
-        const chatAPI = "/api/chat?client=web";
-        const chatAPIBody = {
-            q: queryToProcess,
-            conversation_id: conversationId,
-            stream: true,
-            ...(locationData && {
-                region: locationData.region,
-                country: locationData.country,
-                city: locationData.city,
-                country_code: locationData.countryCode,
-                timezone: locationData.timezone,
-            }),
-            ...(images.length > 0 && { image: images }),
-        };
-
-        const response = await fetch(chatAPI, {
-            method: "POST",
-            headers: {
-                "Content-Type": "application/json",
-            },
-            body: JSON.stringify(chatAPIBody),
-        });
-
-        try {
-            await readChatStream(response);
-        } catch (error) {
-            console.error(error);
-        }
-    }
-
     if (isLoading) {
         return <Loading />;
     }
@@ -293,7 +188,7 @@ export default function SharedChat() {
             <div className={styles.sidePanel}>
                 <SidePanel
                     conversationId={conversationId ?? null}
-                    uploadedFiles={uploadedFiles}
+                    uploadedFiles={[]}
                     isMobileWidth={isMobileWidth}
                 />
             </div>

From ee062d1c4831a6af44060f852fd85c2e58f22be7 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Thu, 7 Nov 2024 18:17:29 -0800
Subject: [PATCH 21/42] Fix parsing for PDFs via content indexing API

---
 src/khoj/processor/content/pdf/pdf_to_entries.py | 11 ++++++++---
 src/khoj/routers/api_content.py                  |  4 ++--
 2 files changed, 10 insertions(+), 5 deletions(-)

diff --git a/src/khoj/processor/content/pdf/pdf_to_entries.py b/src/khoj/processor/content/pdf/pdf_to_entries.py
index 35aa203f..20b72b8c 100644
--- a/src/khoj/processor/content/pdf/pdf_to_entries.py
+++ b/src/khoj/processor/content/pdf/pdf_to_entries.py
@@ -59,9 +59,14 @@ class PdfToEntries(TextToEntries):
         entries: List[str] = []
         entry_to_location_map: List[Tuple[str, str]] = []
         for pdf_file in pdf_files:
-            pdf_entries_per_file = PdfToEntries.extract_text(pdf_file)
-            entries.extend(pdf_entries_per_file)
-            file_to_text_map[pdf_file] = pdf_entries_per_file
+            try:
+                pdf_entries_per_file = PdfToEntries.extract_text(pdf_files[pdf_file])
+                entry_to_location_map += zip(pdf_entries_per_file, [pdf_file] * len(pdf_entries_per_file))
+                entries.extend(pdf_entries_per_file)
+                file_to_text_map[pdf_file] = pdf_entries_per_file
+            except Exception as e:
+                logger.warning(f"Unable to extract entries from file: {pdf_file}")
+                logger.warning(e, exc_info=True)
 
         return file_to_text_map, PdfToEntries.convert_pdf_entries_to_maps(entries, dict(entry_to_location_map))
 
diff --git a/src/khoj/routers/api_content.py b/src/khoj/routers/api_content.py
index d5a6f2ad..a83e0538 100644
--- a/src/khoj/routers/api_content.py
+++ b/src/khoj/routers/api_content.py
@@ -450,11 +450,11 @@ async def indexer(
         for file in files:
             file_data = get_file_content(file)
             if file_data.file_type in index_files:
-                index_files[file_data.file_type][file_data.filename] = (
+                index_files[file_data.file_type][file_data.name] = (
                     file_data.content.decode(file_data.encoding) if file_data.encoding else file_data.content
                 )
             else:
-                logger.warning(f"Skipped indexing unsupported file type sent by {client} client: {file.filename}")
+                logger.warning(f"Skipped indexing unsupported file type sent by {client} client: {file_data.name}")
 
         indexer_input = IndexerInput(
             org=index_files["org"],

From ad46b0e7184859d6474044a9bcfb28b0e66c5086 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Fri, 8 Nov 2024 14:53:20 -0800
Subject: [PATCH 22/42] Label pages when extract text from pdf, docs content.
 Fix scroll area in doc preview.

---
 .../web/app/components/chatInputArea/chatInputArea.tsx |  5 +++++
 .../web/app/components/chatMessage/chatMessage.tsx     |  4 +++-
 src/khoj/routers/api_content.py                        | 10 ++++++++--
 3 files changed, 16 insertions(+), 3 deletions(-)

diff --git a/src/interface/web/app/components/chatInputArea/chatInputArea.tsx b/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
index 2f58fcb5..a5b2482b 100644
--- a/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
+++ b/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
@@ -262,6 +262,11 @@ export const ChatInputArea = forwardRef<HTMLTextAreaElement, ChatInputProps>((pr
 
             return await response.json();
         } catch (error) {
+            setError(
+                "Error converting files. " +
+                    error +
+                    ". Please try again, or contact team@khoj.dev if the issue persists.",
+            );
             console.error("Error converting files:", error);
             return [];
         }
diff --git a/src/interface/web/app/components/chatMessage/chatMessage.tsx b/src/interface/web/app/components/chatMessage/chatMessage.tsx
index 9f9cff12..9deaf955 100644
--- a/src/interface/web/app/components/chatMessage/chatMessage.tsx
+++ b/src/interface/web/app/components/chatMessage/chatMessage.tsx
@@ -728,7 +728,9 @@ const ChatMessage = forwardRef<HTMLDivElement, ChatMessageProps>((props, ref) =>
                                     <DialogTitle>{file.name}</DialogTitle>
                                 </DialogHeader>
                                 <DialogDescription>
-                                    <ScrollArea className="max-h-96">{file.content}</ScrollArea>
+                                    <ScrollArea className="h-72 w-full rounded-md">
+                                        {file.content}
+                                    </ScrollArea>
                                 </DialogDescription>
                             </DialogContent>
                         </Dialog>
diff --git a/src/khoj/routers/api_content.py b/src/khoj/routers/api_content.py
index a83e0538..eb808c22 100644
--- a/src/khoj/routers/api_content.py
+++ b/src/khoj/routers/api_content.py
@@ -396,11 +396,17 @@ async def convert_documents(
 
             if file_data.file_type == "docx":
                 entries_per_page = DocxToEntries.extract_text(file_data.content)
-                extracted_content = "\n".join(entries_per_page)
+                annotated_pages = [
+                    f"Page {index} of {file_data.name}:\n\n{entry}" for index, entry in enumerate(entries_per_page)
+                ]
+                extracted_content = "\n".join(annotated_pages)
 
             elif file_data.file_type == "pdf":
                 entries_per_page = PdfToEntries.extract_text(file_data.content)
-                extracted_content = "\n".join(entries_per_page)
+                annotated_pages = [
+                    f"Page {index} of {file_data.name}:\n\n{entry}" for index, entry in enumerate(entries_per_page)
+                ]
+                extracted_content = "\n".join(annotated_pages)
 
             size_in_bytes = len(extracted_content.encode("utf-8"))
 

From 469517414994e84d08db843e3d7e186326f25122 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Fri, 8 Nov 2024 15:12:48 -0800
Subject: [PATCH 23/42] Add support for file preview in the chat input area
 (before message sent)

---
 .../chatInputArea/chatInputArea.tsx           | 115 +++++++++++-------
 1 file changed, 72 insertions(+), 43 deletions(-)

diff --git a/src/interface/web/app/components/chatInputArea/chatInputArea.tsx b/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
index a5b2482b..bd22a0ee 100644
--- a/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
+++ b/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
@@ -44,6 +44,15 @@ import { InlineLoading } from "../loading/loading";
 import { getIconForSlashCommand, getIconFromFileType } from "@/app/common/iconUtils";
 import { packageFilesForUpload } from "@/app/common/chatFunctions";
 import { convertBytesToText } from "@/app/common/utils";
+import {
+    Dialog,
+    DialogContent,
+    DialogDescription,
+    DialogHeader,
+    DialogTitle,
+    DialogTrigger,
+} from "@/components/ui/dialog";
+import { ScrollArea } from "@/components/ui/scroll-area";
 
 export interface ChatOptions {
     [key: string]: string;
@@ -519,50 +528,70 @@ export const ChatInputArea = forwardRef<HTMLTextAreaElement, ChatInputProps>((pr
                         ))}
                     {convertedAttachedFiles &&
                         Array.from(convertedAttachedFiles).map((file, index) => (
-                            <div key={index} className="relative flex-shrink-0 p-2 group">
-                                <div
-                                    className={`w-auto h-16 object-cover rounded-xl ${props.agentColor ? convertToBGClass(props.agentColor) : "bg-orange-300 hover:bg-orange-500"} bg-opacity-15`}
-                                >
-                                    <div className="flex p-2 flex-col justify-start items-start h-full">
-                                        <span className="text-sm font-bold text-neutral-500 dark:text-neutral-400 text-ellipsis truncate max-w-[200px] break-words">
-                                            {file.name}
-                                        </span>
-                                        <span className="flex items-center gap-1">
-                                            {getIconFromFileType(file.file_type)}
-                                            <span className="text-xs text-neutral-500 dark:text-neutral-400">
-                                                {convertBytesToText(file.size)}
-                                            </span>
-                                        </span>
+                            <Dialog key={index}>
+                                <DialogTrigger asChild>
+                                    <div key={index} className="relative flex-shrink-0 p-2 group">
+                                        <div
+                                            className={`w-auto h-16 object-cover rounded-xl ${props.agentColor ? convertToBGClass(props.agentColor) : "bg-orange-300 hover:bg-orange-500"} bg-opacity-15`}
+                                        >
+                                            <div className="flex p-2 flex-col justify-start items-start h-full">
+                                                <span className="text-sm font-bold text-neutral-500 dark:text-neutral-400 text-ellipsis truncate max-w-[200px] break-words">
+                                                    {file.name}
+                                                </span>
+                                                <span className="flex items-center gap-1">
+                                                    {getIconFromFileType(file.file_type)}
+                                                    <span className="text-xs text-neutral-500 dark:text-neutral-400">
+                                                        {convertBytesToText(file.size)}
+                                                    </span>
+                                                </span>
+                                            </div>
+                                        </div>
+                                        <Button
+                                            variant="ghost"
+                                            size="icon"
+                                            className="absolute -top-0 -right-2 h-5 w-5 rounded-full bg-neutral-200 dark:bg-neutral-600 hover:bg-neutral-300 dark:hover:bg-neutral-500 opacity-0 group-hover:opacity-100 transition-opacity"
+                                            onClick={() => {
+                                                setAttachedFiles((prevFiles) => {
+                                                    const removeFile = file.name;
+                                                    if (!prevFiles) return null;
+                                                    const updatedFiles = Array.from(
+                                                        prevFiles,
+                                                    ).filter((file) => file.name !== removeFile);
+                                                    const dataTransfer = new DataTransfer();
+                                                    updatedFiles.forEach((file) =>
+                                                        dataTransfer.items.add(file),
+                                                    );
+
+                                                    const filteredConvertedAttachedFiles =
+                                                        convertedAttachedFiles.filter(
+                                                            (file) => file.name !== removeFile,
+                                                        );
+
+                                                    props.setUploadedFiles(
+                                                        filteredConvertedAttachedFiles,
+                                                    );
+                                                    setConvertedAttachedFiles(
+                                                        filteredConvertedAttachedFiles,
+                                                    );
+                                                    return dataTransfer.files;
+                                                });
+                                            }}
+                                        >
+                                            <X className="h-3 w-3" />
+                                        </Button>
                                     </div>
-                                </div>
-                                <Button
-                                    variant="ghost"
-                                    size="icon"
-                                    className="absolute -top-0 -right-2 h-5 w-5 rounded-full bg-neutral-200 dark:bg-neutral-600 hover:bg-neutral-300 dark:hover:bg-neutral-500 opacity-0 group-hover:opacity-100 transition-opacity"
-                                    onClick={() => {
-                                        setAttachedFiles((prevFiles) => {
-                                            const removeFile = file.name;
-                                            if (!prevFiles) return null;
-                                            const updatedFiles = Array.from(prevFiles).filter(
-                                                (file) => file.name !== removeFile,
-                                            );
-                                            const dataTransfer = new DataTransfer();
-                                            updatedFiles.forEach((file) =>
-                                                dataTransfer.items.add(file),
-                                            );
-                                            extractTextFromFiles(dataTransfer.files).then(
-                                                (data) => {
-                                                    props.setUploadedFiles(data);
-                                                    setConvertedAttachedFiles(data);
-                                                },
-                                            );
-                                            return dataTransfer.files;
-                                        });
-                                    }}
-                                >
-                                    <X className="h-3 w-3" />
-                                </Button>
-                            </div>
+                                </DialogTrigger>
+                                <DialogContent>
+                                    <DialogHeader>
+                                        <DialogTitle>{file.name}</DialogTitle>
+                                    </DialogHeader>
+                                    <DialogDescription>
+                                        <ScrollArea className="h-72 w-full rounded-md">
+                                            {file.content}
+                                        </ScrollArea>
+                                    </DialogDescription>
+                                </DialogContent>
+                            </Dialog>
                         ))}
                 </div>
                 <div

From 7159b0b735fa3eb07029c475a2ef16eef03f0d8d Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Fri, 8 Nov 2024 15:27:28 -0800
Subject: [PATCH 24/42] Enforce limits on file size when converting to text

---
 .../components/chatInputArea/chatInputArea.tsx    | 10 ++++++++++
 src/khoj/routers/api_content.py                   | 15 +++++++++++++++
 2 files changed, 25 insertions(+)

diff --git a/src/interface/web/app/components/chatInputArea/chatInputArea.tsx b/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
index bd22a0ee..8c692e14 100644
--- a/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
+++ b/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
@@ -237,6 +237,16 @@ export const ChatInputArea = forwardRef<HTMLTextAreaElement, ChatInputProps>((pr
             ? Array.from(nonImageFiles).concat(Array.from(attachedFiles || []))
             : Array.from(attachedFiles || []);
 
+        // Ensure files are below size limit (10 MB)
+        for (let i = 0; i < newFiles.length; i++) {
+            if (newFiles[i].size > 10 * 1024 * 1024) {
+                setWarning(
+                    `File ${newFiles[i].name} is too large. Please upload files smaller than 10 MB.`,
+                );
+                return;
+            }
+        }
+
         const dataTransfer = new DataTransfer();
         newFiles.forEach((file) => dataTransfer.items.add(file));
         setAttachedFiles(dataTransfer.files);
diff --git a/src/khoj/routers/api_content.py b/src/khoj/routers/api_content.py
index eb808c22..40a1fb78 100644
--- a/src/khoj/routers/api_content.py
+++ b/src/khoj/routers/api_content.py
@@ -384,10 +384,25 @@ async def convert_documents(
     files: List[UploadFile],
     client: Optional[str] = None,
 ):
+    MAX_FILE_SIZE_MB = 10  # 10MB limit
+    MAX_FILE_SIZE_BYTES = MAX_FILE_SIZE_MB * 1024 * 1024
+
     converted_files = []
     supported_files = ["org", "markdown", "pdf", "plaintext", "docx"]
 
     for file in files:
+        # Check file size first
+        file_size = 0
+        content = await file.read()
+        file_size = len(content)
+        await file.seek(0)  # Reset file pointer
+
+        if file_size > MAX_FILE_SIZE_BYTES:
+            logger.warning(
+                f"Skipped converting oversized file ({file_size / 1024 / 1024:.1f}MB) sent by {client} client: {file.filename}"
+            )
+            continue
+
         file_data = get_file_content(file)
         if file_data.file_type in supported_files:
             extracted_content = (

From 807687a0acb0339382cf0dbfc1c1656dd3d10dac Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Fri, 8 Nov 2024 16:02:34 -0800
Subject: [PATCH 25/42] Automatically generate titles for conversations from
 history

---
 src/interface/web/app/chat/page.tsx           |  5 +++-
 src/interface/web/app/common/chatFunctions.ts | 17 ++++++++++++
 src/khoj/database/models/__init__.py          |  4 +++
 src/khoj/processor/conversation/prompts.py    | 19 ++++++++++---
 src/khoj/routers/api_chat.py                  | 27 +++++++++++++++++++
 src/khoj/routers/helpers.py                   | 17 ++++++++++++
 6 files changed, 84 insertions(+), 5 deletions(-)

diff --git a/src/interface/web/app/chat/page.tsx b/src/interface/web/app/chat/page.tsx
index d6236499..1489412f 100644
--- a/src/interface/web/app/chat/page.tsx
+++ b/src/interface/web/app/chat/page.tsx
@@ -8,7 +8,7 @@ import ChatHistory from "../components/chatHistory/chatHistory";
 import { useSearchParams } from "next/navigation";
 import Loading from "../components/loading/loading";
 
-import { processMessageChunk } from "../common/chatFunctions";
+import { generateNewTitle, processMessageChunk } from "../common/chatFunctions";
 
 import "katex/dist/katex.min.css";
 
@@ -244,6 +244,9 @@ export default function Chat() {
                 setQueryToProcess("");
                 setProcessQuerySignal(false);
                 setImages([]);
+
+                if (conversationId) generateNewTitle(conversationId, setTitle);
+
                 break;
             }
 
diff --git a/src/interface/web/app/common/chatFunctions.ts b/src/interface/web/app/common/chatFunctions.ts
index 3aff7596..98ca2497 100644
--- a/src/interface/web/app/common/chatFunctions.ts
+++ b/src/interface/web/app/common/chatFunctions.ts
@@ -319,6 +319,23 @@ export async function packageFilesForUpload(files: FileList): Promise<FormData>
     return formData;
 }
 
+export function generateNewTitle(conversationId: string, setTitle: (title: string) => void) {
+    fetch(`/api/chat/title?conversation_id=${conversationId}`, {
+        method: "POST",
+    })
+        .then((res) => {
+            if (!res.ok) throw new Error(`Failed to call API with error ${res.statusText}`);
+            return res.json();
+        })
+        .then((data) => {
+            setTitle(data.title);
+        })
+        .catch((err) => {
+            console.error(err);
+            return;
+        });
+}
+
 export function uploadDataForIndexing(
     files: FileList,
     setWarning: (warning: string) => void,
diff --git a/src/khoj/database/models/__init__.py b/src/khoj/database/models/__init__.py
index 477690cb..bcd8d376 100644
--- a/src/khoj/database/models/__init__.py
+++ b/src/khoj/database/models/__init__.py
@@ -458,7 +458,11 @@ class Conversation(BaseModel):
     user = models.ForeignKey(KhojUser, on_delete=models.CASCADE)
     conversation_log = models.JSONField(default=dict)
     client = models.ForeignKey(ClientApplication, on_delete=models.CASCADE, default=None, null=True, blank=True)
+
+    # Slug is an app-generated conversation identifier. Need not be unique. Used as display title essentially.
     slug = models.CharField(max_length=200, default=None, null=True, blank=True)
+
+    # The title field is explicitly set by the user.
     title = models.CharField(max_length=200, default=None, null=True, blank=True)
     agent = models.ForeignKey(Agent, on_delete=models.SET_NULL, default=None, null=True, blank=True)
     file_filters = models.JSONField(default=list)
diff --git a/src/khoj/processor/conversation/prompts.py b/src/khoj/processor/conversation/prompts.py
index 864b864e..4ff8aa9c 100644
--- a/src/khoj/processor/conversation/prompts.py
+++ b/src/khoj/processor/conversation/prompts.py
@@ -988,16 +988,27 @@ You are an extremely smart and helpful title generator assistant. Given a user q
 
 # Examples:
 User: Show a new Calvin and Hobbes quote every morning at 9am. My Current Location: Shanghai, China
-Khoj: Your daily Calvin and Hobbes Quote
+Assistant: Your daily Calvin and Hobbes Quote
 
 User: Notify me when version 2.0.0 of the sentence transformers python package is released. My Current Location: Mexico City, Mexico
-Khoj: Sentence Transformers Python Package Version 2.0.0 Release
+Assistant: Sentence Transformers Python Package Version 2.0.0 Release
 
 User: Gather the latest tech news on the first sunday of every month.
-Khoj: Your Monthly Dose of Tech News
+Assistant: Your Monthly Dose of Tech News
 
 User Query: {query}
-Khoj:
+Assistant:
+""".strip()
+)
+
+conversation_title_generation = PromptTemplate.from_template(
+    """
+You are an extremely smart and helpful title generator assistant. Given a conversation, extract the subject of the conversation. Crisp, informative, ten words or less.
+
+Conversation History:
+{chat_history}
+
+Assistant:
 """.strip()
 )
 
diff --git a/src/khoj/routers/api_chat.py b/src/khoj/routers/api_chat.py
index 8397eacd..390223d9 100644
--- a/src/khoj/routers/api_chat.py
+++ b/src/khoj/routers/api_chat.py
@@ -40,6 +40,7 @@ from khoj.routers.helpers import (
     ConversationCommandRateLimiter,
     DeleteMessageRequestBody,
     FeedbackData,
+    acreate_title_from_history,
     agenerate_chat_response,
     aget_relevant_information_sources,
     aget_relevant_output_modes,
@@ -530,6 +531,32 @@ async def set_conversation_title(
     )
 
 
+@api_chat.post("/title")
+@requires(["authenticated"])
+async def generate_chat_title(
+    request: Request,
+    common: CommonQueryParams,
+    conversation_id: str,
+):
+    user: KhojUser = request.user.object
+    conversation = await ConversationAdapters.aget_conversation_by_user(user=user, conversation_id=conversation_id)
+
+    # Conversation.title is explicitly set by the user. Do not override.
+    if conversation.title:
+        return {"status": "ok", "title": conversation.title}
+
+    if not conversation:
+        raise HTTPException(status_code=404, detail="Conversation not found")
+
+    new_title = await acreate_title_from_history(request.user.object, conversation=conversation)
+
+    conversation.slug = new_title
+
+    conversation.asave()
+
+    return {"status": "ok", "title": new_title}
+
+
 @api_chat.delete("/conversation/message", response_class=Response)
 @requires(["authenticated"])
 def delete_message(request: Request, delete_request: DeleteMessageRequestBody) -> Response:
diff --git a/src/khoj/routers/helpers.py b/src/khoj/routers/helpers.py
index c62fe4bf..ea5cca71 100644
--- a/src/khoj/routers/helpers.py
+++ b/src/khoj/routers/helpers.py
@@ -299,6 +299,23 @@ def construct_chat_history(conversation_history: dict, n: int = 4, agent_name="A
     return chat_history
 
 
+async def acreate_title_from_history(
+    user: KhojUser,
+    conversation: Conversation,
+):
+    """
+    Create a title from the given conversation history
+    """
+    chat_history = construct_chat_history(conversation.conversation_log)
+
+    title_generation_prompt = prompts.conversation_title_generation.format(chat_history=chat_history)
+
+    with timer("Chat actor: Generate title from conversation history", logger):
+        response = await send_message_to_model_wrapper(title_generation_prompt, user=user)
+
+    return response.strip()
+
+
 async def acreate_title_from_query(query: str, user: KhojUser = None) -> str:
     """
     Create a title from the given query

From 3badb27744788ae5ac7a3e5f78e82e976b594349 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Fri, 8 Nov 2024 23:28:02 -0800
Subject: [PATCH 26/42] Remove stored uploaded files after they're processed.

---
 src/interface/web/app/chat/page.tsx | 1 +
 1 file changed, 1 insertion(+)

diff --git a/src/interface/web/app/chat/page.tsx b/src/interface/web/app/chat/page.tsx
index 1489412f..e069c2e3 100644
--- a/src/interface/web/app/chat/page.tsx
+++ b/src/interface/web/app/chat/page.tsx
@@ -94,6 +94,7 @@ function ChatBodyData(props: ChatBodyDataProps) {
                 size: file.size,
             });
         }
+        localStorage.removeItem("uploadedFiles");
         props.setUploadedFiles(uploadedFiles);
     }, [setQueryToProcess, props.setImages, conversationId]);
 

From bc95a99fb4fb3937751859e2824cb2a1081a07a1 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Sat, 9 Nov 2024 18:22:46 -0800
Subject: [PATCH 27/42] Make tracer the last input parameter for all the
 relevant chat helper methods

---
 .../conversation/anthropic/anthropic_chat.py  |  4 +-
 .../conversation/google/gemini_chat.py        |  5 +--
 .../conversation/offline/chat_model.py        |  4 +-
 src/khoj/processor/conversation/openai/gpt.py |  4 +-
 src/khoj/processor/conversation/utils.py      |  2 +-
 src/khoj/processor/image/generate.py          |  4 +-
 src/khoj/processor/tools/online_search.py     |  6 +--
 src/khoj/processor/tools/run_code.py          |  2 +-
 src/khoj/routers/api.py                       | 10 ++---
 src/khoj/routers/api_chat.py                  | 28 ++++++-------
 src/khoj/routers/helpers.py                   | 42 +++++++++----------
 src/khoj/routers/research.py                  |  2 +-
 12 files changed, 56 insertions(+), 57 deletions(-)

diff --git a/src/khoj/processor/conversation/anthropic/anthropic_chat.py b/src/khoj/processor/conversation/anthropic/anthropic_chat.py
index 1d139604..6989f4c1 100644
--- a/src/khoj/processor/conversation/anthropic/anthropic_chat.py
+++ b/src/khoj/processor/conversation/anthropic/anthropic_chat.py
@@ -36,8 +36,8 @@ def extract_questions_anthropic(
     query_images: Optional[list[str]] = None,
     vision_enabled: bool = False,
     personality_context: Optional[str] = None,
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ):
     """
     Infer search queries to retrieve relevant notes to answer user query
@@ -154,8 +154,8 @@ def converse_anthropic(
     agent: Agent = None,
     query_images: Optional[list[str]] = None,
     vision_available: bool = False,
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ):
     """
     Converse with user using Anthropic's Claude
diff --git a/src/khoj/processor/conversation/google/gemini_chat.py b/src/khoj/processor/conversation/google/gemini_chat.py
index 6d257faa..e4de609f 100644
--- a/src/khoj/processor/conversation/google/gemini_chat.py
+++ b/src/khoj/processor/conversation/google/gemini_chat.py
@@ -37,8 +37,8 @@ def extract_questions_gemini(
     query_images: Optional[list[str]] = None,
     vision_enabled: bool = False,
     personality_context: Optional[str] = None,
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ):
     """
     Infer search queries to retrieve relevant notes to answer user query
@@ -122,7 +122,6 @@ def gemini_send_message_to_model(
     temperature=0,
     model_kwargs=None,
     tracer={},
-    attached_files: str = None,
 ):
     """
     Send message to model
@@ -165,8 +164,8 @@ def converse_gemini(
     agent: Agent = None,
     query_images: Optional[list[str]] = None,
     vision_available: bool = False,
-    tracer={},
     attached_files: str = None,
+    tracer={},
 ):
     """
     Converse with user using Google's Gemini
diff --git a/src/khoj/processor/conversation/offline/chat_model.py b/src/khoj/processor/conversation/offline/chat_model.py
index d0b62f3d..6a25e258 100644
--- a/src/khoj/processor/conversation/offline/chat_model.py
+++ b/src/khoj/processor/conversation/offline/chat_model.py
@@ -37,8 +37,8 @@ def extract_questions_offline(
     max_prompt_size: int = None,
     temperature: float = 0.7,
     personality_context: Optional[str] = None,
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ) -> List[str]:
     """
     Infer search queries to retrieve relevant notes to answer user query
@@ -154,8 +154,8 @@ def converse_offline(
     location_data: LocationData = None,
     user_name: str = None,
     agent: Agent = None,
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ) -> Union[ThreadedGenerator, Iterator[str]]:
     """
     Converse with user using Llama
diff --git a/src/khoj/processor/conversation/openai/gpt.py b/src/khoj/processor/conversation/openai/gpt.py
index 65cdfa3f..f2919afb 100644
--- a/src/khoj/processor/conversation/openai/gpt.py
+++ b/src/khoj/processor/conversation/openai/gpt.py
@@ -34,8 +34,8 @@ def extract_questions(
     query_images: Optional[list[str]] = None,
     vision_enabled: bool = False,
     personality_context: Optional[str] = None,
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ):
     """
     Infer search queries to retrieve relevant notes to answer user query
@@ -154,8 +154,8 @@ def converse(
     agent: Agent = None,
     query_images: Optional[list[str]] = None,
     vision_available: bool = False,
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ):
     """
     Converse with user using OpenAI's ChatGPT
diff --git a/src/khoj/processor/conversation/utils.py b/src/khoj/processor/conversation/utils.py
index 791a98e0..248afa81 100644
--- a/src/khoj/processor/conversation/utils.py
+++ b/src/khoj/processor/conversation/utils.py
@@ -224,8 +224,8 @@ def save_to_conversation_log(
     automation_id: str = None,
     query_images: List[str] = None,
     raw_attached_files: List[FileAttachment] = [],
-    tracer: Dict[str, Any] = {},
     train_of_thought: List[Any] = [],
+    tracer: Dict[str, Any] = {},
 ):
     user_message_time = user_message_time or datetime.now().strftime("%Y-%m-%d %H:%M:%S")
     turn_id = tracer.get("mid") or str(uuid.uuid4())
diff --git a/src/khoj/processor/image/generate.py b/src/khoj/processor/image/generate.py
index ec5254ec..003dae4d 100644
--- a/src/khoj/processor/image/generate.py
+++ b/src/khoj/processor/image/generate.py
@@ -28,8 +28,8 @@ async def text_to_image(
     send_status_func: Optional[Callable] = None,
     query_images: Optional[List[str]] = None,
     agent: Agent = None,
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ):
     status_code = 200
     image = None
@@ -70,8 +70,8 @@ async def text_to_image(
         query_images=query_images,
         user=user,
         agent=agent,
-        tracer=tracer,
         attached_files=attached_files,
+        tracer=tracer,
     )
 
     if send_status_func:
diff --git a/src/khoj/processor/tools/online_search.py b/src/khoj/processor/tools/online_search.py
index 3b4bd16a..6bd14976 100644
--- a/src/khoj/processor/tools/online_search.py
+++ b/src/khoj/processor/tools/online_search.py
@@ -67,8 +67,8 @@ async def search_online(
     max_webpages_to_read: int = DEFAULT_MAX_WEBPAGES_TO_READ,
     query_images: List[str] = None,
     agent: Agent = None,
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ):
     query += " ".join(custom_filters)
     if not is_internet_connected():
@@ -165,9 +165,9 @@ async def read_webpages(
     send_status_func: Optional[Callable] = None,
     query_images: List[str] = None,
     agent: Agent = None,
-    tracer: dict = {},
     max_webpages_to_read: int = DEFAULT_MAX_WEBPAGES_TO_READ,
     attached_files: str = None,
+    tracer: dict = {},
 ):
     "Infer web pages to read from the query and extract relevant information from them"
     logger.info(f"Inferring web pages to read")
@@ -178,8 +178,8 @@ async def read_webpages(
         user,
         query_images,
         agent=agent,
-        tracer=tracer,
         attached_files=attached_files,
+        tracer=tracer,
     )
 
     # Get the top 10 web pages to read
diff --git a/src/khoj/processor/tools/run_code.py b/src/khoj/processor/tools/run_code.py
index 418ab3a2..d5770ca0 100644
--- a/src/khoj/processor/tools/run_code.py
+++ b/src/khoj/processor/tools/run_code.py
@@ -31,8 +31,8 @@ async def run_code(
     query_images: List[str] = None,
     agent: Agent = None,
     sandbox_url: str = SANDBOX_URL,
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ):
     # Generate Code
     if send_status_func:
diff --git a/src/khoj/routers/api.py b/src/khoj/routers/api.py
index 5474497d..ec3ae759 100644
--- a/src/khoj/routers/api.py
+++ b/src/khoj/routers/api.py
@@ -350,8 +350,8 @@ async def extract_references_and_questions(
     send_status_func: Optional[Callable] = None,
     query_images: Optional[List[str]] = None,
     agent: Agent = None,
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ):
     user = request.user.object if request.user.is_authenticated else None
 
@@ -425,8 +425,8 @@ async def extract_references_and_questions(
                 user=user,
                 max_prompt_size=conversation_config.max_prompt_size,
                 personality_context=personality_context,
-                tracer=tracer,
                 attached_files=attached_files,
+                tracer=tracer,
             )
         elif conversation_config.model_type == ChatModelOptions.ModelType.OPENAI:
             openai_chat_config = conversation_config.openai_config
@@ -444,8 +444,8 @@ async def extract_references_and_questions(
                 query_images=query_images,
                 vision_enabled=vision_enabled,
                 personality_context=personality_context,
-                tracer=tracer,
                 attached_files=attached_files,
+                tracer=tracer,
             )
         elif conversation_config.model_type == ChatModelOptions.ModelType.ANTHROPIC:
             api_key = conversation_config.openai_config.api_key
@@ -460,8 +460,8 @@ async def extract_references_and_questions(
                 user=user,
                 vision_enabled=vision_enabled,
                 personality_context=personality_context,
-                tracer=tracer,
                 attached_files=attached_files,
+                tracer=tracer,
             )
         elif conversation_config.model_type == ChatModelOptions.ModelType.GOOGLE:
             api_key = conversation_config.openai_config.api_key
@@ -477,8 +477,8 @@ async def extract_references_and_questions(
                 user=user,
                 vision_enabled=vision_enabled,
                 personality_context=personality_context,
-                tracer=tracer,
                 attached_files=attached_files,
+                tracer=tracer,
             )
 
     # Collate search results as context for GPT
diff --git a/src/khoj/routers/api_chat.py b/src/khoj/routers/api_chat.py
index 390223d9..e9a844b0 100644
--- a/src/khoj/routers/api_chat.py
+++ b/src/khoj/routers/api_chat.py
@@ -756,8 +756,8 @@ async def chat(
                 user=user,
                 query_images=uploaded_images,
                 agent=agent,
-                tracer=tracer,
                 attached_files=attached_file_context,
+                tracer=tracer,
             )
 
             # If we're doing research, we don't want to do anything else
@@ -797,8 +797,8 @@ async def chat(
                 user_name=user_name,
                 location=location,
                 file_filters=conversation.file_filters if conversation else [],
-                tracer=tracer,
                 attached_files=attached_file_context,
+                tracer=tracer,
             ):
                 if isinstance(research_result, InformationCollectionIteration):
                     if research_result.summarizedResult:
@@ -849,8 +849,8 @@ async def chat(
                     query_images=uploaded_images,
                     agent=agent,
                     send_status_func=partial(send_event, ChatEvent.STATUS),
-                    tracer=tracer,
                     attached_files=attached_file_context,
+                    tracer=tracer,
                 ):
                     if isinstance(response, dict) and ChatEvent.STATUS in response:
                         yield response[ChatEvent.STATUS]
@@ -870,9 +870,9 @@ async def chat(
                 client_application=request.user.client_app,
                 conversation_id=conversation_id,
                 query_images=uploaded_images,
-                tracer=tracer,
                 train_of_thought=train_of_thought,
                 raw_attached_files=raw_attached_files,
+                tracer=tracer,
             )
             return
 
@@ -916,9 +916,9 @@ async def chat(
                 inferred_queries=[query_to_run],
                 automation_id=automation.id,
                 query_images=uploaded_images,
-                tracer=tracer,
                 train_of_thought=train_of_thought,
                 raw_attached_files=raw_attached_files,
+                tracer=tracer,
             )
             async for result in send_llm_response(llm_response):
                 yield result
@@ -940,8 +940,8 @@ async def chat(
                     partial(send_event, ChatEvent.STATUS),
                     query_images=uploaded_images,
                     agent=agent,
-                    tracer=tracer,
                     attached_files=attached_file_context,
+                    tracer=tracer,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
                         yield result[ChatEvent.STATUS]
@@ -986,8 +986,8 @@ async def chat(
                     custom_filters,
                     query_images=uploaded_images,
                     agent=agent,
-                    tracer=tracer,
                     attached_files=attached_file_context,
+                    tracer=tracer,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
                         yield result[ChatEvent.STATUS]
@@ -1012,8 +1012,8 @@ async def chat(
                     partial(send_event, ChatEvent.STATUS),
                     query_images=uploaded_images,
                     agent=agent,
-                    tracer=tracer,
                     attached_files=attached_file_context,
+                    tracer=tracer,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
                         yield result[ChatEvent.STATUS]
@@ -1053,8 +1053,8 @@ async def chat(
                     partial(send_event, ChatEvent.STATUS),
                     query_images=uploaded_images,
                     agent=agent,
-                    tracer=tracer,
                     attached_files=attached_file_context,
+                    tracer=tracer,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
                         yield result[ChatEvent.STATUS]
@@ -1093,8 +1093,8 @@ async def chat(
                 send_status_func=partial(send_event, ChatEvent.STATUS),
                 query_images=uploaded_images,
                 agent=agent,
-                tracer=tracer,
                 attached_files=attached_file_context,
+                tracer=tracer,
             ):
                 if isinstance(result, dict) and ChatEvent.STATUS in result:
                     yield result[ChatEvent.STATUS]
@@ -1125,10 +1125,10 @@ async def chat(
                 compiled_references=compiled_references,
                 online_results=online_results,
                 query_images=uploaded_images,
-                tracer=tracer,
                 train_of_thought=train_of_thought,
                 attached_file_context=attached_file_context,
                 raw_attached_files=raw_attached_files,
+                tracer=tracer,
             )
             content_obj = {
                 "intentType": intent_type,
@@ -1157,8 +1157,8 @@ async def chat(
                 user=user,
                 agent=agent,
                 send_status_func=partial(send_event, ChatEvent.STATUS),
-                tracer=tracer,
                 attached_files=attached_file_context,
+                tracer=tracer,
             ):
                 if isinstance(result, dict) and ChatEvent.STATUS in result:
                     yield result[ChatEvent.STATUS]
@@ -1186,10 +1186,10 @@ async def chat(
                 compiled_references=compiled_references,
                 online_results=online_results,
                 query_images=uploaded_images,
-                tracer=tracer,
                 train_of_thought=train_of_thought,
                 attached_file_context=attached_file_context,
                 raw_attached_files=raw_attached_files,
+                tracer=tracer,
             )
 
             async for result in send_llm_response(json.dumps(content_obj)):
@@ -1215,10 +1215,10 @@ async def chat(
             user_name,
             researched_results,
             uploaded_images,
-            tracer,
             train_of_thought,
             attached_file_context,
             raw_attached_files,
+            tracer,
         )
 
         # Send Response
diff --git a/src/khoj/routers/helpers.py b/src/khoj/routers/helpers.py
index ea5cca71..aed76ad1 100644
--- a/src/khoj/routers/helpers.py
+++ b/src/khoj/routers/helpers.py
@@ -361,8 +361,8 @@ async def aget_relevant_information_sources(
     user: KhojUser,
     query_images: List[str] = None,
     agent: Agent = None,
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ):
     """
     Given a query, determine which of the available tools the agent should use in order to answer appropriately.
@@ -399,8 +399,8 @@ async def aget_relevant_information_sources(
             relevant_tools_prompt,
             response_type="json_object",
             user=user,
-            tracer=tracer,
             attached_files=attached_files,
+            tracer=tracer,
         )
 
     try:
@@ -509,8 +509,8 @@ async def infer_webpage_urls(
     user: KhojUser,
     query_images: List[str] = None,
     agent: Agent = None,
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ) -> List[str]:
     """
     Infer webpage links from the given query
@@ -539,8 +539,8 @@ async def infer_webpage_urls(
             query_images=query_images,
             response_type="json_object",
             user=user,
-            tracer=tracer,
             attached_files=attached_files,
+            tracer=tracer,
         )
 
     # Validate that the response is a non-empty, JSON-serializable list of URLs
@@ -565,8 +565,8 @@ async def generate_online_subqueries(
     user: KhojUser,
     query_images: List[str] = None,
     agent: Agent = None,
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ) -> List[str]:
     """
     Generate subqueries from the given query
@@ -595,8 +595,8 @@ async def generate_online_subqueries(
             query_images=query_images,
             response_type="json_object",
             user=user,
-            tracer=tracer,
             attached_files=attached_files,
+            tracer=tracer,
         )
 
     # Validate that the response is a non-empty, JSON-serializable list
@@ -718,8 +718,8 @@ async def generate_summary_from_files(
     query_images: List[str] = None,
     agent: Agent = None,
     send_status_func: Optional[Callable] = None,
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ):
     try:
         file_objects = None
@@ -781,8 +781,8 @@ async def generate_excalidraw_diagram(
     user: KhojUser = None,
     agent: Agent = None,
     send_status_func: Optional[Callable] = None,
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ):
     if send_status_func:
         async for event in send_status_func("**Enhancing the Diagramming Prompt**"):
@@ -797,8 +797,8 @@ async def generate_excalidraw_diagram(
         query_images=query_images,
         user=user,
         agent=agent,
-        tracer=tracer,
         attached_files=attached_files,
+        tracer=tracer,
     )
 
     if send_status_func:
@@ -824,8 +824,8 @@ async def generate_better_diagram_description(
     query_images: List[str] = None,
     user: KhojUser = None,
     agent: Agent = None,
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ) -> str:
     """
     Generate a diagram description from the given query and context
@@ -866,8 +866,8 @@ async def generate_better_diagram_description(
             improve_diagram_description_prompt,
             query_images=query_images,
             user=user,
-            tracer=tracer,
             attached_files=attached_files,
+            tracer=tracer,
         )
         response = response.strip()
         if response.startswith(('"', "'")) and response.endswith(('"', "'")):
@@ -914,8 +914,8 @@ async def generate_better_image_prompt(
     query_images: Optional[List[str]] = None,
     user: KhojUser = None,
     agent: Agent = None,
-    tracer: dict = {},
     attached_files: str = "",
+    tracer: dict = {},
 ) -> str:
     """
     Generate a better image prompt from the given query
@@ -963,7 +963,7 @@ async def generate_better_image_prompt(
 
     with timer("Chat actor: Generate contextual image prompt", logger):
         response = await send_message_to_model_wrapper(
-            image_prompt, query_images=query_images, user=user, tracer=tracer, attached_files=attached_files
+            image_prompt, query_images=query_images, user=user, attached_files=attached_files, tracer=tracer
         )
         response = response.strip()
         if response.startswith(('"', "'")) and response.endswith(('"', "'")):
@@ -979,8 +979,8 @@ async def send_message_to_model_wrapper(
     user: KhojUser = None,
     query_images: List[str] = None,
     context: str = "",
-    tracer: dict = {},
     attached_files: str = None,
+    tracer: dict = {},
 ):
     conversation_config: ChatModelOptions = await ConversationAdapters.aget_default_conversation_config(user)
     vision_available = conversation_config.vision_enabled
@@ -1106,8 +1106,8 @@ def send_message_to_model_wrapper_sync(
     system_message: str = "",
     response_type: str = "text",
     user: KhojUser = None,
-    tracer: dict = {},
     attached_files: str = "",
+    tracer: dict = {},
 ):
     conversation_config: ChatModelOptions = ConversationAdapters.get_default_conversation_config(user)
 
@@ -1225,10 +1225,10 @@ def generate_chat_response(
     user_name: Optional[str] = None,
     meta_research: str = "",
     query_images: Optional[List[str]] = None,
-    tracer: dict = {},
     train_of_thought: List[Any] = [],
     attached_files: str = None,
     raw_attached_files: List[FileAttachment] = None,
+    tracer: dict = {},
 ) -> Tuple[Union[ThreadedGenerator, Iterator[str]], Dict[str, str]]:
     # Initialize Variables
     chat_response = None
@@ -1252,9 +1252,9 @@ def generate_chat_response(
             client_application=client_application,
             conversation_id=conversation_id,
             query_images=query_images,
-            tracer=tracer,
             train_of_thought=train_of_thought,
             raw_attached_files=raw_attached_files,
+            tracer=tracer,
         )
 
         conversation_config = ConversationAdapters.get_valid_conversation_config(user, conversation)
@@ -1281,8 +1281,8 @@ def generate_chat_response(
                 location_data=location_data,
                 user_name=user_name,
                 agent=agent,
-                tracer=tracer,
                 attached_files=attached_files,
+                tracer=tracer,
             )
 
         elif conversation_config.model_type == ChatModelOptions.ModelType.OPENAI:
@@ -1307,8 +1307,8 @@ def generate_chat_response(
                 user_name=user_name,
                 agent=agent,
                 vision_available=vision_available,
-                tracer=tracer,
                 attached_files=attached_files,
+                tracer=tracer,
             )
 
         elif conversation_config.model_type == ChatModelOptions.ModelType.ANTHROPIC:
@@ -1330,8 +1330,8 @@ def generate_chat_response(
                 user_name=user_name,
                 agent=agent,
                 vision_available=vision_available,
-                tracer=tracer,
                 attached_files=attached_files,
+                tracer=tracer,
             )
         elif conversation_config.model_type == ChatModelOptions.ModelType.GOOGLE:
             api_key = conversation_config.openai_config.api_key
@@ -1352,8 +1352,8 @@ def generate_chat_response(
                 agent=agent,
                 query_images=query_images,
                 vision_available=vision_available,
-                tracer=tracer,
                 attached_files=attached_files,
+                tracer=tracer,
             )
 
         metadata.update({"chat_model": conversation_config.chat_model})
diff --git a/src/khoj/routers/research.py b/src/khoj/routers/research.py
index dc34009c..c7755b0a 100644
--- a/src/khoj/routers/research.py
+++ b/src/khoj/routers/research.py
@@ -268,8 +268,8 @@ async def execute_information_collection(
                     send_status_func,
                     query_images=query_images,
                     agent=agent,
-                    tracer=tracer,
                     attached_files=attached_files,
+                    tracer=tracer,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
                         yield result[ChatEvent.STATUS]

From e5ac076fc4a9a65c360cebdb1ec4a07f281a765e Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Sat, 9 Nov 2024 18:27:46 -0800
Subject: [PATCH 28/42] Move construct_chat_history method back to
 conversation.utils.py

---
 src/khoj/processor/conversation/utils.py | 29 +++++++++++++++++++++++
 src/khoj/processor/tools/run_code.py     |  9 +++++--
 src/khoj/routers/helpers.py              | 30 +-----------------------
 src/khoj/routers/research.py             |  2 +-
 4 files changed, 38 insertions(+), 32 deletions(-)

diff --git a/src/khoj/processor/conversation/utils.py b/src/khoj/processor/conversation/utils.py
index 248afa81..6dee4378 100644
--- a/src/khoj/processor/conversation/utils.py
+++ b/src/khoj/processor/conversation/utils.py
@@ -524,6 +524,35 @@ def get_image_from_url(image_url: str, type="pil"):
         return ImageWithType(content=None, type=None)
 
 
+def construct_chat_history(conversation_history: dict, n: int = 4, agent_name="AI") -> str:
+    chat_history = ""
+    for chat in conversation_history.get("chat", [])[-n:]:
+        if chat["by"] == "khoj" and chat["intent"].get("type") in ["remember", "reminder", "summarize"]:
+            chat_history += f"User: {chat['intent']['query']}\n"
+
+            if chat["intent"].get("inferred-queries"):
+                chat_history += f'{agent_name}: {{"queries": {chat["intent"].get("inferred-queries")}}}\n'
+
+            chat_history += f"{agent_name}: {chat['message']}\n\n"
+        elif chat["by"] == "khoj" and ("text-to-image" in chat["intent"].get("type")):
+            chat_history += f"User: {chat['intent']['query']}\n"
+            chat_history += f"{agent_name}: [generated image redacted for space]\n"
+        elif chat["by"] == "khoj" and ("excalidraw" in chat["intent"].get("type")):
+            chat_history += f"User: {chat['intent']['query']}\n"
+            chat_history += f"{agent_name}: {chat['intent']['inferred-queries'][0]}\n"
+        elif chat["by"] == "you":
+            raw_attached_files = chat.get("attachedFiles")
+            if raw_attached_files:
+                attached_files: Dict[str, str] = {}
+                for file in raw_attached_files:
+                    attached_files[file["name"]] = file["content"]
+
+                attached_file_context = gather_raw_attached_files(attached_files)
+                chat_history += f"User: {attached_file_context}\n"
+
+    return chat_history
+
+
 def commit_conversation_trace(
     session: list[ChatMessage],
     response: str | list[dict],
diff --git a/src/khoj/processor/tools/run_code.py b/src/khoj/processor/tools/run_code.py
index d5770ca0..c4e2ace1 100644
--- a/src/khoj/processor/tools/run_code.py
+++ b/src/khoj/processor/tools/run_code.py
@@ -10,8 +10,13 @@ import aiohttp
 from khoj.database.adapters import ais_user_subscribed
 from khoj.database.models import Agent, KhojUser
 from khoj.processor.conversation import prompts
-from khoj.processor.conversation.utils import ChatEvent, clean_code_python, clean_json
-from khoj.routers.helpers import construct_chat_history, send_message_to_model_wrapper
+from khoj.processor.conversation.utils import (
+    ChatEvent,
+    clean_code_python,
+    clean_json,
+    construct_chat_history,
+)
+from khoj.routers.helpers import send_message_to_model_wrapper
 from khoj.utils.helpers import timer
 from khoj.utils.rawconfig import LocationData
 
diff --git a/src/khoj/routers/helpers.py b/src/khoj/routers/helpers.py
index aed76ad1..93ec6828 100644
--- a/src/khoj/routers/helpers.py
+++ b/src/khoj/routers/helpers.py
@@ -91,6 +91,7 @@ from khoj.processor.conversation.utils import (
     ChatEvent,
     ThreadedGenerator,
     clean_json,
+    construct_chat_history,
     generate_chatml_messages_with_context,
     save_to_conversation_log,
 )
@@ -270,35 +271,6 @@ def gather_raw_attached_files(
     return f"I have attached the following files:\n\n{contextual_data}"
 
 
-def construct_chat_history(conversation_history: dict, n: int = 4, agent_name="AI") -> str:
-    chat_history = ""
-    for chat in conversation_history.get("chat", [])[-n:]:
-        if chat["by"] == "khoj" and chat["intent"].get("type") in ["remember", "reminder", "summarize"]:
-            chat_history += f"User: {chat['intent']['query']}\n"
-
-            if chat["intent"].get("inferred-queries"):
-                chat_history += f'{agent_name}: {{"queries": {chat["intent"].get("inferred-queries")}}}\n'
-
-            chat_history += f"{agent_name}: {chat['message']}\n\n"
-        elif chat["by"] == "khoj" and ("text-to-image" in chat["intent"].get("type")):
-            chat_history += f"User: {chat['intent']['query']}\n"
-            chat_history += f"{agent_name}: [generated image redacted for space]\n"
-        elif chat["by"] == "khoj" and ("excalidraw" in chat["intent"].get("type")):
-            chat_history += f"User: {chat['intent']['query']}\n"
-            chat_history += f"{agent_name}: {chat['intent']['inferred-queries'][0]}\n"
-        elif chat["by"] == "you":
-            raw_attached_files = chat.get("attachedFiles")
-            if raw_attached_files:
-                attached_files: Dict[str, str] = {}
-                for file in raw_attached_files:
-                    attached_files[file["name"]] = file["content"]
-
-                attached_file_context = gather_raw_attached_files(attached_files)
-                chat_history += f"User: {attached_file_context}\n"
-
-    return chat_history
-
-
 async def acreate_title_from_history(
     user: KhojUser,
     conversation: Conversation,
diff --git a/src/khoj/routers/research.py b/src/khoj/routers/research.py
index c7755b0a..76203989 100644
--- a/src/khoj/routers/research.py
+++ b/src/khoj/routers/research.py
@@ -11,6 +11,7 @@ from khoj.processor.conversation import prompts
 from khoj.processor.conversation.utils import (
     InformationCollectionIteration,
     clean_json,
+    construct_chat_history,
     construct_iteration_history,
     construct_tool_chat_history,
 )
@@ -19,7 +20,6 @@ from khoj.processor.tools.run_code import run_code
 from khoj.routers.api import extract_references_and_questions
 from khoj.routers.helpers import (
     ChatEvent,
-    construct_chat_history,
     generate_summary_from_files,
     send_message_to_model_wrapper,
 )

From dbf0c262477d1f4c1fb02564f2d44cd72222e59f Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Sat, 9 Nov 2024 18:42:42 -0800
Subject: [PATCH 29/42] Remove _summary_ description in function descriptions

---
 src/khoj/processor/conversation/utils.py | 2 +-
 src/khoj/routers/helpers.py              | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/src/khoj/processor/conversation/utils.py b/src/khoj/processor/conversation/utils.py
index 6dee4378..27e23a88 100644
--- a/src/khoj/processor/conversation/utils.py
+++ b/src/khoj/processor/conversation/utils.py
@@ -293,7 +293,7 @@ def construct_structured_message(message: str, images: list[str], model_type: st
 def gather_raw_attached_files(
     attached_files: Dict[str, str],
 ):
-    """_summary_
+    """
     Gather contextual data from the given (raw) files
     """
 
diff --git a/src/khoj/routers/helpers.py b/src/khoj/routers/helpers.py
index 93ec6828..d24e0b1c 100644
--- a/src/khoj/routers/helpers.py
+++ b/src/khoj/routers/helpers.py
@@ -258,7 +258,7 @@ async def agenerate_chat_response(*args):
 def gather_raw_attached_files(
     attached_files: Dict[str, str],
 ):
-    """_summary_
+    """
     Gather contextual data from the given (raw) files
     """
 

From 459318be13ea2b6ff3b7ace01982ba32fdc0f48e Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Sat, 9 Nov 2024 18:46:34 -0800
Subject: [PATCH 30/42] And random suffixes to decreases any clash probability
 when writing tmp files to disc

---
 src/khoj/processor/content/docx/docx_to_entries.py | 4 +++-
 src/khoj/processor/content/pdf/pdf_to_entries.py   | 4 +++-
 2 files changed, 6 insertions(+), 2 deletions(-)

diff --git a/src/khoj/processor/content/docx/docx_to_entries.py b/src/khoj/processor/content/docx/docx_to_entries.py
index a2948caa..9ca9ef1f 100644
--- a/src/khoj/processor/content/docx/docx_to_entries.py
+++ b/src/khoj/processor/content/docx/docx_to_entries.py
@@ -1,6 +1,7 @@
 import logging
 import os
 from datetime import datetime
+from random import random
 from typing import Dict, List, Tuple
 
 from langchain_community.document_loaders import Docx2txtLoader
@@ -94,7 +95,8 @@ class DocxToEntries(TextToEntries):
         """Extract text from specified DOCX file"""
         try:
             timestamp_now = datetime.utcnow().timestamp()
-            tmp_file = f"tmp_docx_file_{timestamp_now}.docx"
+            random_suffix = random.randint(0, 1000)
+            tmp_file = f"tmp_docx_file_{timestamp_now}_{random_suffix}.docx"
             docx_entry_by_pages = []
             with open(tmp_file, "wb") as f:
                 bytes_content = docx_file
diff --git a/src/khoj/processor/content/pdf/pdf_to_entries.py b/src/khoj/processor/content/pdf/pdf_to_entries.py
index 20b72b8c..a5de1335 100644
--- a/src/khoj/processor/content/pdf/pdf_to_entries.py
+++ b/src/khoj/processor/content/pdf/pdf_to_entries.py
@@ -2,6 +2,7 @@ import base64
 import logging
 import os
 from datetime import datetime
+from random import random
 from typing import Dict, List, Tuple
 
 from langchain_community.document_loaders import PyMuPDFLoader
@@ -98,7 +99,8 @@ class PdfToEntries(TextToEntries):
         try:
             # Write the PDF file to a temporary file, as it is stored in byte format in the pdf_file object and the PDF Loader expects a file path
             timestamp_now = datetime.utcnow().timestamp()
-            tmp_file = f"tmp_pdf_file_{timestamp_now}.pdf"
+            random_suffix = random.randint(0, 1000)
+            tmp_file = f"tmp_pdf_file_{timestamp_now}_{random_suffix}.pdf"
             pdf_entry_by_pages = []
             with open(f"{tmp_file}", "wb") as f:
                 f.write(pdf_file)

From 835fa80a4bc360768f7c8d0da57a6465d1a99f75 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Sat, 9 Nov 2024 18:51:00 -0800
Subject: [PATCH 31/42] Allow docx conversion in the chatFunction.ts

---
 src/interface/web/app/common/chatFunctions.ts | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/src/interface/web/app/common/chatFunctions.ts b/src/interface/web/app/common/chatFunctions.ts
index 98ca2497..b4777ba8 100644
--- a/src/interface/web/app/common/chatFunctions.ts
+++ b/src/interface/web/app/common/chatFunctions.ts
@@ -294,6 +294,9 @@ export async function packageFilesForUpload(files: FileList): Promise<FormData>
                         fileType = "text/html";
                     } else if (fileExtension === "pdf") {
                         fileType = "application/pdf";
+                    } else if (fileExtension === "docx") {
+                        fileType =
+                            "application/vnd.openxmlformats-officedocument.wordprocessingml.document";
                     } else {
                         // Skip this file if its type is not supported
                         resolve();

From 92b6b3ef7b87c8b06496ef35a30f93e29c821a80 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Sat, 9 Nov 2024 19:17:00 -0800
Subject: [PATCH 32/42] Add attached files to latest structured message in chat
 ml format

---
 .../conversation/anthropic/anthropic_chat.py  |  4 +--
 .../conversation/google/gemini_chat.py        |  4 +--
 src/khoj/processor/conversation/openai/gpt.py |  5 +--
 src/khoj/processor/conversation/utils.py      | 31 ++++++++++++-------
 4 files changed, 23 insertions(+), 21 deletions(-)

diff --git a/src/khoj/processor/conversation/anthropic/anthropic_chat.py b/src/khoj/processor/conversation/anthropic/anthropic_chat.py
index 6989f4c1..fac8dfa4 100644
--- a/src/khoj/processor/conversation/anthropic/anthropic_chat.py
+++ b/src/khoj/processor/conversation/anthropic/anthropic_chat.py
@@ -83,13 +83,11 @@ def extract_questions_anthropic(
         images=query_images,
         model_type=ChatModelOptions.ModelType.ANTHROPIC,
         vision_enabled=vision_enabled,
+        attached_file_context=attached_files,
     )
 
     messages = []
 
-    if attached_files:
-        messages.append(ChatMessage(content=attached_files, role="user"))
-
     messages.append(ChatMessage(content=prompt, role="user"))
 
     messages, system_prompt = format_messages_for_anthropic(messages, system_prompt)
diff --git a/src/khoj/processor/conversation/google/gemini_chat.py b/src/khoj/processor/conversation/google/gemini_chat.py
index e4de609f..b7a7739f 100644
--- a/src/khoj/processor/conversation/google/gemini_chat.py
+++ b/src/khoj/processor/conversation/google/gemini_chat.py
@@ -84,13 +84,11 @@ def extract_questions_gemini(
         images=query_images,
         model_type=ChatModelOptions.ModelType.GOOGLE,
         vision_enabled=vision_enabled,
+        attached_file_context=attached_files,
     )
 
     messages = []
 
-    if attached_files:
-        messages.append(ChatMessage(content=attached_files, role="user"))
-
     messages.append(ChatMessage(content=prompt, role="user"))
     messages.append(ChatMessage(content=system_prompt, role="system"))
 
diff --git a/src/khoj/processor/conversation/openai/gpt.py b/src/khoj/processor/conversation/openai/gpt.py
index f2919afb..70d208d8 100644
--- a/src/khoj/processor/conversation/openai/gpt.py
+++ b/src/khoj/processor/conversation/openai/gpt.py
@@ -80,13 +80,10 @@ def extract_questions(
         images=query_images,
         model_type=ChatModelOptions.ModelType.OPENAI,
         vision_enabled=vision_enabled,
+        attached_file_context=attached_files,
     )
 
     messages = []
-
-    if attached_files:
-        messages.append(ChatMessage(content=attached_files, role="user"))
-
     messages.append(ChatMessage(content=prompt, role="user"))
 
     response = send_message_to_model(
diff --git a/src/khoj/processor/conversation/utils.py b/src/khoj/processor/conversation/utils.py
index 27e23a88..7187acdb 100644
--- a/src/khoj/processor/conversation/utils.py
+++ b/src/khoj/processor/conversation/utils.py
@@ -271,23 +271,31 @@ Khoj: "{inferred_queries if ("text-to-image" in intent_type) else chat_response}
     )
 
 
-def construct_structured_message(message: str, images: list[str], model_type: str, vision_enabled: bool):
+def construct_structured_message(
+    message: str, images: list[str], model_type: str, vision_enabled: bool, attached_file_context: str
+):
     """
     Format messages into appropriate multimedia format for supported chat model types
     """
     if not images or not vision_enabled:
         return message
 
+    constructed_messages = [
+        {"type": "text", "text": message},
+    ]
+
+    if not is_none_or_empty(attached_file_context):
+        constructed_messages.append({"type": "text", "text": attached_file_context})
+
     if model_type in [
         ChatModelOptions.ModelType.OPENAI,
         ChatModelOptions.ModelType.GOOGLE,
         ChatModelOptions.ModelType.ANTHROPIC,
     ]:
-        return [
-            {"type": "text", "text": message},
-            *[{"type": "image_url", "image_url": {"url": image}} for image in images],
-        ]
-    return message
+        for image in images:
+            constructed_messages.append({"type": "image_url", "image_url": {"url": image}})
+
+    return constructed_messages
 
 
 def gather_raw_attached_files(
@@ -362,7 +370,9 @@ def generate_chatml_messages_with_context(
             chatml_messages.insert(0, reconstructed_context_message)
 
         role = "user" if chat["by"] == "you" else "assistant"
-        message_content = construct_structured_message(chat["message"], chat.get("images"), model_type, vision_enabled)
+        message_content = construct_structured_message(
+            chat["message"], chat.get("images"), model_type, vision_enabled, attached_file_context=attached_files
+        )
 
         reconstructed_message = ChatMessage(content=message_content, role=role)
         chatml_messages.insert(0, reconstructed_message)
@@ -374,16 +384,15 @@ def generate_chatml_messages_with_context(
     if not is_none_or_empty(user_message):
         messages.append(
             ChatMessage(
-                content=construct_structured_message(user_message, query_images, model_type, vision_enabled),
+                content=construct_structured_message(
+                    user_message, query_images, model_type, vision_enabled, attached_files
+                ),
                 role="user",
             )
         )
     if not is_none_or_empty(context_message):
         messages.append(ChatMessage(content=context_message, role="user"))
 
-    if not is_none_or_empty(attached_files):
-        messages.append(ChatMessage(content=attached_files, role="user"))
-
     if len(chatml_messages) > 0:
         messages += chatml_messages
 

From bd5502811549067546be57ce90325f1759dc021c Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Sat, 9 Nov 2024 19:17:18 -0800
Subject: [PATCH 33/42] Fix randint import from random when creating filenames
 for tmp

---
 src/khoj/processor/content/docx/docx_to_entries.py | 4 ++--
 src/khoj/processor/content/pdf/pdf_to_entries.py   | 4 ++--
 2 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/src/khoj/processor/content/docx/docx_to_entries.py b/src/khoj/processor/content/docx/docx_to_entries.py
index 9ca9ef1f..55dd8bac 100644
--- a/src/khoj/processor/content/docx/docx_to_entries.py
+++ b/src/khoj/processor/content/docx/docx_to_entries.py
@@ -1,7 +1,7 @@
 import logging
 import os
 from datetime import datetime
-from random import random
+from random import randint
 from typing import Dict, List, Tuple
 
 from langchain_community.document_loaders import Docx2txtLoader
@@ -95,7 +95,7 @@ class DocxToEntries(TextToEntries):
         """Extract text from specified DOCX file"""
         try:
             timestamp_now = datetime.utcnow().timestamp()
-            random_suffix = random.randint(0, 1000)
+            random_suffix = randint(0, 1000)
             tmp_file = f"tmp_docx_file_{timestamp_now}_{random_suffix}.docx"
             docx_entry_by_pages = []
             with open(tmp_file, "wb") as f:
diff --git a/src/khoj/processor/content/pdf/pdf_to_entries.py b/src/khoj/processor/content/pdf/pdf_to_entries.py
index a5de1335..311ac807 100644
--- a/src/khoj/processor/content/pdf/pdf_to_entries.py
+++ b/src/khoj/processor/content/pdf/pdf_to_entries.py
@@ -2,7 +2,7 @@ import base64
 import logging
 import os
 from datetime import datetime
-from random import random
+from random import randint
 from typing import Dict, List, Tuple
 
 from langchain_community.document_loaders import PyMuPDFLoader
@@ -99,7 +99,7 @@ class PdfToEntries(TextToEntries):
         try:
             # Write the PDF file to a temporary file, as it is stored in byte format in the pdf_file object and the PDF Loader expects a file path
             timestamp_now = datetime.utcnow().timestamp()
-            random_suffix = random.randint(0, 1000)
+            random_suffix = randint(0, 1000)
             tmp_file = f"tmp_pdf_file_{timestamp_now}_{random_suffix}.pdf"
             pdf_entry_by_pages = []
             with open(f"{tmp_file}", "wb") as f:

From 79b15e45945e03ea87cab1bde9be7fbd23c02af8 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Sat, 9 Nov 2024 19:37:30 -0800
Subject: [PATCH 34/42] Only add images when they're present and vision enabled

---
 src/khoj/processor/conversation/utils.py | 8 +++-----
 1 file changed, 3 insertions(+), 5 deletions(-)

diff --git a/src/khoj/processor/conversation/utils.py b/src/khoj/processor/conversation/utils.py
index 7187acdb..ec050c93 100644
--- a/src/khoj/processor/conversation/utils.py
+++ b/src/khoj/processor/conversation/utils.py
@@ -277,9 +277,6 @@ def construct_structured_message(
     """
     Format messages into appropriate multimedia format for supported chat model types
     """
-    if not images or not vision_enabled:
-        return message
-
     constructed_messages = [
         {"type": "text", "text": message},
     ]
@@ -292,8 +289,9 @@ def construct_structured_message(
         ChatModelOptions.ModelType.GOOGLE,
         ChatModelOptions.ModelType.ANTHROPIC,
     ]:
-        for image in images:
-            constructed_messages.append({"type": "image_url", "image_url": {"url": image}})
+        if vision_enabled and images:
+            for image in images:
+                constructed_messages.append({"type": "image_url", "image_url": {"url": image}})
 
     return constructed_messages
 

From 2c543bedd76a8485a01d0c0a48e24780e9ab3f75 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Sat, 9 Nov 2024 19:40:27 -0800
Subject: [PATCH 35/42] Add typing to the constructed messages listed

---
 src/khoj/processor/conversation/utils.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/src/khoj/processor/conversation/utils.py b/src/khoj/processor/conversation/utils.py
index ec050c93..518cb732 100644
--- a/src/khoj/processor/conversation/utils.py
+++ b/src/khoj/processor/conversation/utils.py
@@ -277,7 +277,7 @@ def construct_structured_message(
     """
     Format messages into appropriate multimedia format for supported chat model types
     """
-    constructed_messages = [
+    constructed_messages: List[ChatMessage] = [
         {"type": "text", "text": message},
     ]
 

From 170d959feb037c9e41e55c52533d5ec5d009ab00 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Sat, 9 Nov 2024 19:52:46 -0800
Subject: [PATCH 36/42] Handle offline messages differently, as they don't
 respond well to the structured messages

---
 src/khoj/processor/conversation/utils.py | 19 +++++++++++--------
 1 file changed, 11 insertions(+), 8 deletions(-)

diff --git a/src/khoj/processor/conversation/utils.py b/src/khoj/processor/conversation/utils.py
index 518cb732..90de45d1 100644
--- a/src/khoj/processor/conversation/utils.py
+++ b/src/khoj/processor/conversation/utils.py
@@ -277,23 +277,26 @@ def construct_structured_message(
     """
     Format messages into appropriate multimedia format for supported chat model types
     """
-    constructed_messages: List[ChatMessage] = [
-        {"type": "text", "text": message},
-    ]
-
-    if not is_none_or_empty(attached_file_context):
-        constructed_messages.append({"type": "text", "text": attached_file_context})
-
     if model_type in [
         ChatModelOptions.ModelType.OPENAI,
         ChatModelOptions.ModelType.GOOGLE,
         ChatModelOptions.ModelType.ANTHROPIC,
     ]:
+        constructed_messages: List[Any] = [
+            {"type": "text", "text": message},
+        ]
+
+        if not is_none_or_empty(attached_file_context):
+            constructed_messages.append({"type": "text", "text": attached_file_context})
         if vision_enabled and images:
             for image in images:
                 constructed_messages.append({"type": "image_url", "image_url": {"url": image}})
+        return constructed_messages
 
-    return constructed_messages
+    if not is_none_or_empty(attached_file_context):
+        return f"{attached_file_context}\n\n{message}"
+
+    return message
 
 
 def gather_raw_attached_files(

From 55200be4fa7ad81d06fe4c9c6b4121da4f154ede Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Sun, 10 Nov 2024 19:16:43 -0800
Subject: [PATCH 37/42] Apply agent color fill to the toggle both in off and on
 states

---
 .../web/app/components/chatInputArea/chatInputArea.tsx       | 5 ++++-
 1 file changed, 4 insertions(+), 1 deletion(-)

diff --git a/src/interface/web/app/components/chatInputArea/chatInputArea.tsx b/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
index 8c692e14..49157f56 100644
--- a/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
+++ b/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
@@ -723,7 +723,10 @@ export const ChatInputArea = forwardRef<HTMLTextAreaElement, ChatInputProps>((pr
                                         className={`w-6 h-6 inline-block ${props.agentColor ? convertColorToTextClass(props.agentColor) : convertColorToTextClass("orange")} rounded-full`}
                                     />
                                 ) : (
-                                    <ToggleLeft className={`w-6 h-6 inline-block rounded-full`} />
+                                    <ToggleLeft
+                                        weight="fill"
+                                        className={`w-6 h-6 inline-block ${props.agentColor ? convertColorToTextClass(props.agentColor) : convertColorToTextClass("orange")} rounded-full`}
+                                    />
                                 )}
                             </Button>
                         </TooltipTrigger>

From fd15fc1e598b3dc7f720e86cb336c3ae1199b66f Mon Sep 17 00:00:00 2001
From: Debanjum <debanjum@gmail.com>
Date: Mon, 11 Nov 2024 03:23:58 -0800
Subject: [PATCH 38/42] Move construct chat history back to it's original
 position in file

Keep function where it original was allows tracking diffs and change
history more easily
---
 src/khoj/processor/conversation/utils.py | 58 ++++++++++++------------
 1 file changed, 29 insertions(+), 29 deletions(-)

diff --git a/src/khoj/processor/conversation/utils.py b/src/khoj/processor/conversation/utils.py
index b46e60ed..7fe83d06 100644
--- a/src/khoj/processor/conversation/utils.py
+++ b/src/khoj/processor/conversation/utils.py
@@ -140,6 +140,35 @@ def construct_iteration_history(
     return previous_iterations_history
 
 
+def construct_chat_history(conversation_history: dict, n: int = 4, agent_name="AI") -> str:
+    chat_history = ""
+    for chat in conversation_history.get("chat", [])[-n:]:
+        if chat["by"] == "khoj" and chat["intent"].get("type") in ["remember", "reminder", "summarize"]:
+            chat_history += f"User: {chat['intent']['query']}\n"
+
+            if chat["intent"].get("inferred-queries"):
+                chat_history += f'{agent_name}: {{"queries": {chat["intent"].get("inferred-queries")}}}\n'
+
+            chat_history += f"{agent_name}: {chat['message']}\n\n"
+        elif chat["by"] == "khoj" and ("text-to-image" in chat["intent"].get("type")):
+            chat_history += f"User: {chat['intent']['query']}\n"
+            chat_history += f"{agent_name}: [generated image redacted for space]\n"
+        elif chat["by"] == "khoj" and ("excalidraw" in chat["intent"].get("type")):
+            chat_history += f"User: {chat['intent']['query']}\n"
+            chat_history += f"{agent_name}: {chat['intent']['inferred-queries'][0]}\n"
+        elif chat["by"] == "you":
+            raw_attached_files = chat.get("attachedFiles")
+            if raw_attached_files:
+                attached_files: Dict[str, str] = {}
+                for file in raw_attached_files:
+                    attached_files[file["name"]] = file["content"]
+
+                attached_file_context = gather_raw_attached_files(attached_files)
+                chat_history += f"User: {attached_file_context}\n"
+
+    return chat_history
+
+
 def construct_tool_chat_history(
     previous_iterations: List[InformationCollectionIteration], tool: ConversationCommand = None
 ) -> Dict[str, list]:
@@ -540,35 +569,6 @@ def get_image_from_url(image_url: str, type="pil"):
         return ImageWithType(content=None, type=None)
 
 
-def construct_chat_history(conversation_history: dict, n: int = 4, agent_name="AI") -> str:
-    chat_history = ""
-    for chat in conversation_history.get("chat", [])[-n:]:
-        if chat["by"] == "khoj" and chat["intent"].get("type") in ["remember", "reminder", "summarize"]:
-            chat_history += f"User: {chat['intent']['query']}\n"
-
-            if chat["intent"].get("inferred-queries"):
-                chat_history += f'{agent_name}: {{"queries": {chat["intent"].get("inferred-queries")}}}\n'
-
-            chat_history += f"{agent_name}: {chat['message']}\n\n"
-        elif chat["by"] == "khoj" and ("text-to-image" in chat["intent"].get("type")):
-            chat_history += f"User: {chat['intent']['query']}\n"
-            chat_history += f"{agent_name}: [generated image redacted for space]\n"
-        elif chat["by"] == "khoj" and ("excalidraw" in chat["intent"].get("type")):
-            chat_history += f"User: {chat['intent']['query']}\n"
-            chat_history += f"{agent_name}: {chat['intent']['inferred-queries'][0]}\n"
-        elif chat["by"] == "you":
-            raw_attached_files = chat.get("attachedFiles")
-            if raw_attached_files:
-                attached_files: Dict[str, str] = {}
-                for file in raw_attached_files:
-                    attached_files[file["name"]] = file["content"]
-
-                attached_file_context = gather_raw_attached_files(attached_files)
-                chat_history += f"User: {attached_file_context}\n"
-
-    return chat_history
-
-
 def commit_conversation_trace(
     session: list[ChatMessage],
     response: str | list[dict],

From 4223b355dcc065de20d5d282edf5e6c91891977e Mon Sep 17 00:00:00 2001
From: Debanjum <debanjum@gmail.com>
Date: Mon, 11 Nov 2024 03:20:35 -0800
Subject: [PATCH 39/42] Use python stdlib methods to write pdf, docx to temp
 files for loaders

Use python standard method tempfile.NamedTemporaryFile to write,
delete temporary files safely.
---
 .../processor/content/docx/docx_to_entries.py | 28 +++++---------
 .../processor/content/pdf/pdf_to_entries.py   | 37 +++++++------------
 2 files changed, 23 insertions(+), 42 deletions(-)

diff --git a/src/khoj/processor/content/docx/docx_to_entries.py b/src/khoj/processor/content/docx/docx_to_entries.py
index 55dd8bac..19d9ba13 100644
--- a/src/khoj/processor/content/docx/docx_to_entries.py
+++ b/src/khoj/processor/content/docx/docx_to_entries.py
@@ -1,7 +1,5 @@
 import logging
-import os
-from datetime import datetime
-from random import randint
+import tempfile
 from typing import Dict, List, Tuple
 
 from langchain_community.document_loaders import Docx2txtLoader
@@ -94,26 +92,20 @@ class DocxToEntries(TextToEntries):
     def extract_text(docx_file):
         """Extract text from specified DOCX file"""
         try:
-            timestamp_now = datetime.utcnow().timestamp()
-            random_suffix = randint(0, 1000)
-            tmp_file = f"tmp_docx_file_{timestamp_now}_{random_suffix}.docx"
             docx_entry_by_pages = []
-            with open(tmp_file, "wb") as f:
-                bytes_content = docx_file
-                f.write(bytes_content)
+            # Create temp file with .docx extension that gets auto-deleted
+            with tempfile.NamedTemporaryFile(suffix=".docx", delete=True) as tmp:
+                tmp.write(docx_file)
+                tmp.flush()  # Ensure all data is written
 
-            # Load the content using Docx2txtLoader
-            loader = Docx2txtLoader(tmp_file)
-            docx_entries_per_file = loader.load()
-
-            # Convert the loaded entries into the desired format
-            docx_entry_by_pages = [page.page_content for page in docx_entries_per_file]
+                # Load the content using Docx2txtLoader
+                loader = Docx2txtLoader(tmp.name)
+                docx_entries_per_file = loader.load()
 
+                # Convert the loaded entries into the desired format
+                docx_entry_by_pages = [page.page_content for page in docx_entries_per_file]
         except Exception as e:
             logger.warning(f"Unable to extract text from file: {docx_file}")
             logger.warning(e, exc_info=True)
-        finally:
-            if os.path.exists(f"{tmp_file}"):
-                os.remove(f"{tmp_file}")
 
         return docx_entry_by_pages
diff --git a/src/khoj/processor/content/pdf/pdf_to_entries.py b/src/khoj/processor/content/pdf/pdf_to_entries.py
index 311ac807..39685996 100644
--- a/src/khoj/processor/content/pdf/pdf_to_entries.py
+++ b/src/khoj/processor/content/pdf/pdf_to_entries.py
@@ -1,14 +1,10 @@
-import base64
 import logging
-import os
-from datetime import datetime
-from random import randint
+import tempfile
+from io import BytesIO
 from typing import Dict, List, Tuple
 
 from langchain_community.document_loaders import PyMuPDFLoader
 
-# importing FileObjectAdapter so that we can add new files and debug file object db.
-# from khoj.database.adapters import FileObjectAdapters
 from khoj.database.models import Entry as DbEntry
 from khoj.database.models import KhojUser
 from khoj.processor.content.text_to_entries import TextToEntries
@@ -97,26 +93,19 @@ class PdfToEntries(TextToEntries):
     def extract_text(pdf_file):
         """Extract text from specified PDF files"""
         try:
-            # Write the PDF file to a temporary file, as it is stored in byte format in the pdf_file object and the PDF Loader expects a file path
-            timestamp_now = datetime.utcnow().timestamp()
-            random_suffix = randint(0, 1000)
-            tmp_file = f"tmp_pdf_file_{timestamp_now}_{random_suffix}.pdf"
-            pdf_entry_by_pages = []
-            with open(f"{tmp_file}", "wb") as f:
-                f.write(pdf_file)
-            try:
-                loader = PyMuPDFLoader(f"{tmp_file}", extract_images=False)
-                pdf_entry_by_pages = [page.page_content for page in loader.load()]
-            except ImportError:
-                loader = PyMuPDFLoader(f"{tmp_file}")
-                pdf_entry_by_pages = [
-                    page.page_content for page in loader.load()
-                ]  # page_content items list for a given pdf.
+            # Create temp file with .pdf extension that gets auto-deleted
+            with tempfile.NamedTemporaryFile(suffix=".pdf", delete=True) as tmpf:
+                tmpf.write(pdf_file)
+                tmpf.flush()  # Ensure all data is written
+
+                # Load the content using PyMuPDFLoader
+                loader = PyMuPDFLoader(tmpf.name, extract_images=True)
+                pdf_entries_per_file = loader.load()
+
+                # Convert the loaded entries into the desired format
+                pdf_entry_by_pages = [page.page_content for page in pdf_entries_per_file]
         except Exception as e:
             logger.warning(f"Unable to process file: {pdf_file}. This file will not be indexed.")
             logger.warning(e, exc_info=True)
-        finally:
-            if os.path.exists(f"{tmp_file}"):
-                os.remove(f"{tmp_file}")
 
         return pdf_entry_by_pages

From 7954f39633c8429ddbb9b4535ce1cc37e5f0c36e Mon Sep 17 00:00:00 2001
From: Debanjum <debanjum@gmail.com>
Date: Mon, 11 Nov 2024 04:06:17 -0800
Subject: [PATCH 40/42] Use accept param to file input to indicate supported
 file types in web app

Remove unused total size calculations in chat input
---
 .../web/app/components/chatInputArea/chatInputArea.tsx        | 4 +---
 1 file changed, 1 insertion(+), 3 deletions(-)

diff --git a/src/interface/web/app/components/chatInputArea/chatInputArea.tsx b/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
index 49157f56..8b276562 100644
--- a/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
+++ b/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
@@ -257,9 +257,6 @@ export const ChatInputArea = forwardRef<HTMLTextAreaElement, ChatInputProps>((pr
             setConvertedAttachedFiles(data);
         });
 
-        const totalSize = Array.from(files).reduce((acc, file) => acc + file.size, 0);
-        const totalSizeInMB = totalSize / (1024 * 1024);
-
         // Set focus to the input for user message after uploading files
         chatInputRef?.current?.focus();
     }
@@ -612,6 +609,7 @@ export const ChatInputArea = forwardRef<HTMLTextAreaElement, ChatInputProps>((pr
                 >
                     <input
                         type="file"
+                        accept=".pdf,.doc,.docx,.txt,.md,.org,.jpg,.jpeg,.png,.webp"
                         multiple={true}
                         ref={fileInputRef}
                         onChange={handleFileChange}

From ae4eb96d483ab4ef12a9adf541eed2f32e93944b Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Mon, 11 Nov 2024 09:34:04 -0800
Subject: [PATCH 41/42] Consolidate file name to icon mapping

---
 src/interface/web/app/common/iconUtils.tsx    |  18 ++-
 .../chatInputArea/chatInputArea.tsx           |   4 +-
 .../components/chatMessage/chatMessage.tsx    |   4 +-
 .../web/app/components/logo/fileLogo.tsx      | 108 ------------------
 4 files changed, 11 insertions(+), 123 deletions(-)

diff --git a/src/interface/web/app/common/iconUtils.tsx b/src/interface/web/app/common/iconUtils.tsx
index 4fad417e..f266cac5 100644
--- a/src/interface/web/app/common/iconUtils.tsx
+++ b/src/interface/web/app/common/iconUtils.tsx
@@ -50,8 +50,10 @@ import {
     Broadcast,
     KeyReturn,
     FilePdf,
+    FileMd,
+    MicrosoftWordLogo,
 } from "@phosphor-icons/react";
-import { Markdown, OrgMode, Pdf, Word } from "@/app/components/logo/fileLogo";
+import { OrgMode } from "@/app/components/logo/fileLogo";
 
 interface IconMap {
     [key: string]: (color: string, width: string, height: string) => JSX.Element | null;
@@ -217,13 +219,6 @@ export function getIconForSlashCommand(command: string, customClassName: string
     return <ArrowRight className={className} />;
 }
 
-export function getIconFromFileType(fileType: string) {
-    if (fileType == "pdf") {
-        return <FilePdf className="w-6 h-6 text-muted-foreground inline-flex mr-1" />;
-    }
-    return <File className="w-6 h-6 text-muted-foreground inline-flex mr-1" />;
-}
-
 function getIconFromIconName(
     iconName: string,
     color: string = "gray",
@@ -246,11 +241,12 @@ function getIconFromFilename(
             return <OrgMode className={className} />;
         case "markdown":
         case "md":
-            return <Markdown className={className} />;
+            return <FileMd className={className} />;
         case "pdf":
-            return <Pdf className={className} />;
+            return <FilePdf className={className} />;
         case "doc":
-            return <Word className={className} />;
+        case "docx":
+            return <MicrosoftWordLogo className={className} />;
         case "jpg":
         case "jpeg":
         case "png":
diff --git a/src/interface/web/app/components/chatInputArea/chatInputArea.tsx b/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
index 49157f56..3ee0e258 100644
--- a/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
+++ b/src/interface/web/app/components/chatInputArea/chatInputArea.tsx
@@ -41,7 +41,7 @@ import { convertColorToTextClass, convertToBGClass } from "@/app/common/colorUti
 
 import LoginPrompt from "../loginPrompt/loginPrompt";
 import { InlineLoading } from "../loading/loading";
-import { getIconForSlashCommand, getIconFromFileType } from "@/app/common/iconUtils";
+import { getIconForSlashCommand, getIconFromFilename } from "@/app/common/iconUtils";
 import { packageFilesForUpload } from "@/app/common/chatFunctions";
 import { convertBytesToText } from "@/app/common/utils";
 import {
@@ -549,7 +549,7 @@ export const ChatInputArea = forwardRef<HTMLTextAreaElement, ChatInputProps>((pr
                                                     {file.name}
                                                 </span>
                                                 <span className="flex items-center gap-1">
-                                                    {getIconFromFileType(file.file_type)}
+                                                    {getIconFromFilename(file.file_type)}
                                                     <span className="text-xs text-neutral-500 dark:text-neutral-400">
                                                         {convertBytesToText(file.size)}
                                                     </span>
diff --git a/src/interface/web/app/components/chatMessage/chatMessage.tsx b/src/interface/web/app/components/chatMessage/chatMessage.tsx
index 9deaf955..bfe9e9e4 100644
--- a/src/interface/web/app/components/chatMessage/chatMessage.tsx
+++ b/src/interface/web/app/components/chatMessage/chatMessage.tsx
@@ -51,7 +51,7 @@ import {
 import { DialogTitle } from "@radix-ui/react-dialog";
 import { convertBytesToText } from "@/app/common/utils";
 import { ScrollArea } from "@/components/ui/scroll-area";
-import { getIconFromFileType } from "@/app/common/iconUtils";
+import { getIconFromFilename } from "@/app/common/iconUtils";
 
 const md = new markdownIt({
     html: true,
@@ -714,7 +714,7 @@ const ChatMessage = forwardRef<HTMLDivElement, ChatMessageProps>((props, ref) =>
                         <Dialog key={index}>
                             <DialogTrigger>
                                 <div className="flex items-center space-x-2 cursor-pointer bg-gray-500 bg-opacity-25 rounded-lg m-1 p-2 w-full">
-                                    {getIconFromFileType(file.file_type)}
+                                    {getIconFromFilename(file.file_type)}
                                     <span className="truncate">{file.name}</span>
                                     {file.size && (
                                         <span className="text-gray-400">
diff --git a/src/interface/web/app/components/logo/fileLogo.tsx b/src/interface/web/app/components/logo/fileLogo.tsx
index 56bef3f7..e6e8217f 100644
--- a/src/interface/web/app/components/logo/fileLogo.tsx
+++ b/src/interface/web/app/components/logo/fileLogo.tsx
@@ -81,111 +81,3 @@ export function OrgMode({ className }: { className?: string }) {
         </svg>
     );
 }
-
-export function Markdown({ className }: { className?: string }) {
-    const classes = className ?? "w-6 h-6 text-muted-foreground inline-flex mr-1";
-    return (
-        <svg
-            className={`${classes}`}
-            xmlns="http://www.w3.org/2000/svg"
-            width="208"
-            height="128"
-            viewBox="0 0 208 128"
-        >
-            <rect
-                width="198"
-                height="118"
-                x="5"
-                y="5"
-                ry="10"
-                stroke="#000"
-                strokeWidth="10"
-                fill="none"
-            />
-            <path d="M30 98V30h20l20 25 20-25h20v68H90V59L70 84 50 59v39zm125 0l-30-33h20V30h20v35h20z" />
-        </svg>
-    );
-}
-
-export function Pdf({ className }: { className?: string }) {
-    const classes = className ?? "w-6 h-6 text-muted-foreground inline-flex mr-1";
-    return (
-        <svg
-            className={`${classes}`}
-            xmlns="http://www.w3.org/2000/svg"
-            enableBackground="new 0 0 334.371 380.563"
-            version="1.1"
-            viewBox="0 0 14 16"
-        >
-            <g transform="matrix(.04589 0 0 .04589 -.66877 -.73379)">
-                <polygon
-                    points="51.791 356.65 51.791 23.99 204.5 23.99 282.65 102.07 282.65 356.65"
-                    fill="#fff"
-                    strokeWidth="212.65"
-                />
-                <path
-                    d="m201.19 31.99 73.46 73.393v243.26h-214.86v-316.66h141.4m6.623-16h-164.02v348.66h246.85v-265.9z"
-                    strokeWidth="21.791"
-                />
-            </g>
-            <g transform="matrix(.04589 0 0 .04589 -.66877 -.73379)">
-                <polygon
-                    points="282.65 356.65 51.791 356.65 51.791 23.99 204.5 23.99 206.31 25.8 206.31 100.33 280.9 100.33 282.65 102.07"
-                    fill="#fff"
-                    strokeWidth="212.65"
-                />
-                <path
-                    d="m198.31 31.99v76.337h76.337v240.32h-214.86v-316.66h138.52m9.5-16h-164.02v348.66h246.85v-265.9l-6.43-6.424h-69.907v-69.842z"
-                    strokeWidth="21.791"
-                />
-            </g>
-            <g transform="matrix(.04589 0 0 .04589 -.66877 -.73379)" strokeWidth="21.791">
-                <polygon points="258.31 87.75 219.64 87.75 219.64 48.667 258.31 86.38" />
-                <path d="m227.64 67.646 12.41 12.104h-12.41v-12.104m-5.002-27.229h-10.998v55.333h54.666v-12.742z" />
-            </g>
-            <g
-                transform="matrix(.04589 0 0 .04589 -.66877 -.73379)"
-                fill="#ed1c24"
-                strokeWidth="212.65"
-            >
-                <polygon points="311.89 284.49 22.544 284.49 22.544 167.68 37.291 152.94 37.291 171.49 297.15 171.49 297.15 152.94 311.89 167.68" />
-                <path d="m303.65 168.63 1.747 1.747v107.62h-276.35v-107.62l1.747-1.747v9.362h272.85v-9.362m-12.999-31.385v27.747h-246.86v-27.747l-27.747 27.747v126h302.35v-126z" />
-            </g>
-            <rect x="1.7219" y="7.9544" width="10.684" height="4.0307" fill="none" />
-            <g transform="matrix(.04589 0 0 .04589 1.7219 11.733)" fill="#fff" strokeWidth="21.791">
-                <path d="m9.216 0v-83.2h30.464q6.784 0 12.928 1.408 6.144 1.28 10.752 4.608 4.608 3.2 7.296 8.576 2.816 5.248 2.816 13.056 0 7.68-2.816 13.184-2.688 5.504-7.296 9.088-4.608 3.456-10.624 5.248-6.016 1.664-12.544 1.664h-8.96v26.368zm22.016-43.776h7.936q6.528 0 9.6-3.072 3.2-3.072 3.2-8.704t-3.456-7.936-9.856-2.304h-7.424z" />
-                <path d="m87.04 0v-83.2h24.576q9.472 0 17.28 2.304 7.936 2.304 13.568 7.296t8.704 12.8q3.2 7.808 3.2 18.816t-3.072 18.944-8.704 13.056q-5.504 5.12-13.184 7.552-7.552 2.432-16.512 2.432zm22.016-17.664h1.28q4.48 0 8.448-1.024 3.968-1.152 6.784-3.84 2.944-2.688 4.608-7.424t1.664-12.032-1.664-11.904-4.608-7.168q-2.816-2.56-6.784-3.456-3.968-1.024-8.448-1.024h-1.28z" />
-                <path d="m169.22 0v-83.2h54.272v18.432h-32.256v15.872h27.648v18.432h-27.648v30.464z" />
-            </g>
-        </svg>
-    );
-}
-
-export function Word({ className }: { className?: string }) {
-    const classes = className ?? "w-6 h-6 text-muted-foreground inline-flex mr-1";
-    return (
-        <svg
-            className={`${classes}`}
-            xmlns="http://www.w3.org/2000/svg"
-            fill="#FFF"
-            stroke-miterlimit="10"
-            strokeWidth="2"
-            viewBox="0 0 96 96"
-        >
-            <path
-                stroke="#979593"
-                d="M67.1716 7H27c-1.1046 0-2 .8954-2 2v78c0 1.1046.8954 2 2 2h58c1.1046 0 2-.8954 2-2V26.8284c0-.5304-.2107-1.0391-.5858-1.4142L68.5858 7.5858C68.2107 7.2107 67.702 7 67.1716 7z"
-            />
-            <path fill="none" stroke="#979593" d="M67 7v18c0 1.1046.8954 2 2 2h18" />
-            <path
-                fill="#C8C6C4"
-                d="M79 61H48v-2h31c.5523 0 1 .4477 1 1s-.4477 1-1 1zm0-6H48v-2h31c.5523 0 1 .4477 1 1s-.4477 1-1 1zm0-6H48v-2h31c.5523 0 1 .4477 1 1s-.4477 1-1 1zm0-6H48v-2h31c.5523 0 1 .4477 1 1s-.4477 1-1 1zm0 24H48v-2h31c.5523 0 1 .4477 1 1s-.4477 1-1 1z"
-            />
-            <path
-                fill="#185ABD"
-                d="M12 74h32c2.2091 0 4-1.7909 4-4V38c0-2.2091-1.7909-4-4-4H12c-2.2091 0-4 1.7909-4 4v32c0 2.2091 1.7909 4 4 4z"
-            />
-            <path d="M21.6245 60.6455c.0661.522.109.9769.1296 1.3657h.0762c.0306-.3685.0889-.8129.1751-1.3349.0862-.5211.1703-.961.2517-1.319L25.7911 44h4.5702l3.6562 15.1272c.183.7468.3353 1.6973.457 2.8532h.0608c.0508-.7979.1777-1.7184.3809-2.7615L37.8413 44H42l-5.1183 22h-4.86l-3.4885-14.5744c-.1016-.4197-.2158-.9663-.3428-1.6417-.127-.6745-.2057-1.1656-.236-1.4724h-.0608c-.0407.358-.1195.8896-.2364 1.595-.1169.7062-.211 1.2273-.2819 1.565L24.1 66h-4.9357L14 44h4.2349l3.1843 15.3882c.0709.3165.1392.7362.2053 1.2573z" />
-        </svg>
-    );
-}

From 2bb2ff27a4983e40d41f3981827645927b256723 Mon Sep 17 00:00:00 2001
From: sabaimran <narmiabas@gmail.com>
Date: Mon, 11 Nov 2024 11:21:26 -0800
Subject: [PATCH 42/42] Rename attached_files to query_files. Update relevant
 backend and client-side code.

---
 src/interface/web/app/chat/page.tsx           | 26 ++++---
 .../components/chatHistory/chatHistory.tsx    |  2 +-
 .../components/chatMessage/chatMessage.tsx    | 25 +++---
 .../processor/content/pdf/pdf_to_entries.py   | 10 ++-
 .../conversation/anthropic/anthropic_chat.py  |  8 +-
 .../conversation/google/gemini_chat.py        |  8 +-
 .../conversation/offline/chat_model.py        |  8 +-
 src/khoj/processor/conversation/openai/gpt.py |  8 +-
 src/khoj/processor/conversation/utils.py      | 44 +++++------
 src/khoj/processor/image/generate.py          |  4 +-
 src/khoj/processor/tools/online_search.py     |  8 +-
 src/khoj/processor/tools/run_code.py          |  8 +-
 src/khoj/routers/api.py                       | 10 +--
 src/khoj/routers/api_chat.py                  | 44 +++++------
 src/khoj/routers/helpers.py                   | 76 +++++++++----------
 src/khoj/routers/research.py                  | 16 ++--
 16 files changed, 159 insertions(+), 146 deletions(-)

diff --git a/src/interface/web/app/chat/page.tsx b/src/interface/web/app/chat/page.tsx
index e069c2e3..966cdd17 100644
--- a/src/interface/web/app/chat/page.tsx
+++ b/src/interface/web/app/chat/page.tsx
@@ -83,19 +83,21 @@ function ChatBodyData(props: ChatBodyDataProps) {
         }
 
         const storedUploadedFiles = localStorage.getItem("uploadedFiles");
-        const parsedFiles = storedUploadedFiles ? JSON.parse(storedUploadedFiles) : [];
 
-        const uploadedFiles: AttachedFileText[] = [];
-        for (const file of parsedFiles) {
-            uploadedFiles.push({
-                name: file.name,
-                file_type: file.file_type,
-                content: file.content,
-                size: file.size,
-            });
+        if (storedUploadedFiles) {
+            const parsedFiles = storedUploadedFiles ? JSON.parse(storedUploadedFiles) : [];
+            const uploadedFiles: AttachedFileText[] = [];
+            for (const file of parsedFiles) {
+                uploadedFiles.push({
+                    name: file.name,
+                    file_type: file.file_type,
+                    content: file.content,
+                    size: file.size,
+                });
+            }
+            localStorage.removeItem("uploadedFiles");
+            props.setUploadedFiles(uploadedFiles);
         }
-        localStorage.removeItem("uploadedFiles");
-        props.setUploadedFiles(uploadedFiles);
     }, [setQueryToProcess, props.setImages, conversationId]);
 
     useEffect(() => {
@@ -212,7 +214,7 @@ export default function Chat() {
                 timestamp: new Date().toISOString(),
                 rawQuery: queryToProcess || "",
                 images: images,
-                attachedFiles: uploadedFiles,
+                queryFiles: uploadedFiles,
             };
             setMessages((prevMessages) => [...prevMessages, newStreamMessage]);
             setProcessQuerySignal(true);
diff --git a/src/interface/web/app/components/chatHistory/chatHistory.tsx b/src/interface/web/app/components/chatHistory/chatHistory.tsx
index 37b44f3a..ea566df4 100644
--- a/src/interface/web/app/components/chatHistory/chatHistory.tsx
+++ b/src/interface/web/app/components/chatHistory/chatHistory.tsx
@@ -373,7 +373,7 @@ export default function ChatHistory(props: ChatHistoryProps) {
                                             images: message.images,
                                             conversationId: props.conversationId,
                                             turnId: messageTurnId,
-                                            attachedFiles: message.attachedFiles,
+                                            queryFiles: message.queryFiles,
                                         }}
                                         customClassName="fullHistory"
                                         borderLeftColor={`${data?.agent?.color}-500`}
diff --git a/src/interface/web/app/components/chatMessage/chatMessage.tsx b/src/interface/web/app/components/chatMessage/chatMessage.tsx
index bfe9e9e4..aae271b1 100644
--- a/src/interface/web/app/components/chatMessage/chatMessage.tsx
+++ b/src/interface/web/app/components/chatMessage/chatMessage.tsx
@@ -161,7 +161,7 @@ export interface SingleChatMessage {
     images?: string[];
     conversationId: string;
     turnId?: string;
-    attachedFiles?: AttachedFileText[];
+    queryFiles?: AttachedFileText[];
 }
 
 export interface StreamMessage {
@@ -178,7 +178,7 @@ export interface StreamMessage {
     intentType?: string;
     inferredQueries?: string[];
     turnId?: string;
-    attachedFiles?: AttachedFileText[];
+    queryFiles?: AttachedFileText[];
 }
 
 export interface ChatHistoryData {
@@ -708,16 +708,21 @@ const ChatMessage = forwardRef<HTMLDivElement, ChatMessageProps>((props, ref) =>
             onMouseLeave={(event) => setIsHovering(false)}
             onMouseEnter={(event) => setIsHovering(true)}
         >
-            {props.chatMessage.attachedFiles && props.chatMessage.attachedFiles.length > 0 && (
-                <div className="flex flex-wrap flex-col m-2">
-                    {props.chatMessage.attachedFiles.map((file, index) => (
+            {props.chatMessage.queryFiles && props.chatMessage.queryFiles.length > 0 && (
+                <div className="flex flex-wrap flex-col m-2 max-w-full">
+                    {props.chatMessage.queryFiles.map((file, index) => (
                         <Dialog key={index}>
-                            <DialogTrigger>
-                                <div className="flex items-center space-x-2 cursor-pointer bg-gray-500 bg-opacity-25 rounded-lg m-1 p-2 w-full">
-                                    {getIconFromFilename(file.file_type)}
-                                    <span className="truncate">{file.name}</span>
+                            <DialogTrigger asChild>
+                                <div
+                                    className="flex items-center space-x-2 cursor-pointer bg-gray-500 bg-opacity-25 rounded-lg m-1 p-2 w-full
+                                "
+                                >
+                                    <div className="flex-shrink-0">
+                                        {getIconFromFilename(file.file_type)}
+                                    </div>
+                                    <span className="truncate flex-1 min-w-0">{file.name}</span>
                                     {file.size && (
-                                        <span className="text-gray-400">
+                                        <span className="text-gray-400 flex-shrink-0">
                                             ({convertBytesToText(file.size)})
                                         </span>
                                     )}
diff --git a/src/khoj/processor/content/pdf/pdf_to_entries.py b/src/khoj/processor/content/pdf/pdf_to_entries.py
index 39685996..f1ac5104 100644
--- a/src/khoj/processor/content/pdf/pdf_to_entries.py
+++ b/src/khoj/processor/content/pdf/pdf_to_entries.py
@@ -103,9 +103,17 @@ class PdfToEntries(TextToEntries):
                 pdf_entries_per_file = loader.load()
 
                 # Convert the loaded entries into the desired format
-                pdf_entry_by_pages = [page.page_content for page in pdf_entries_per_file]
+                pdf_entry_by_pages = [PdfToEntries.clean_text(page.page_content) for page in pdf_entries_per_file]
         except Exception as e:
             logger.warning(f"Unable to process file: {pdf_file}. This file will not be indexed.")
             logger.warning(e, exc_info=True)
 
         return pdf_entry_by_pages
+
+    @staticmethod
+    def clean_text(text: str) -> str:
+        # Remove null bytes
+        text = text.replace("\x00", "")
+        # Replace invalid Unicode
+        text = text.encode("utf-8", errors="ignore").decode("utf-8")
+        return text
diff --git a/src/khoj/processor/conversation/anthropic/anthropic_chat.py b/src/khoj/processor/conversation/anthropic/anthropic_chat.py
index fac8dfa4..c934292a 100644
--- a/src/khoj/processor/conversation/anthropic/anthropic_chat.py
+++ b/src/khoj/processor/conversation/anthropic/anthropic_chat.py
@@ -36,7 +36,7 @@ def extract_questions_anthropic(
     query_images: Optional[list[str]] = None,
     vision_enabled: bool = False,
     personality_context: Optional[str] = None,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ):
     """
@@ -83,7 +83,7 @@ def extract_questions_anthropic(
         images=query_images,
         model_type=ChatModelOptions.ModelType.ANTHROPIC,
         vision_enabled=vision_enabled,
-        attached_file_context=attached_files,
+        attached_file_context=query_files,
     )
 
     messages = []
@@ -152,7 +152,7 @@ def converse_anthropic(
     agent: Agent = None,
     query_images: Optional[list[str]] = None,
     vision_available: bool = False,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ):
     """
@@ -210,7 +210,7 @@ def converse_anthropic(
         query_images=query_images,
         vision_enabled=vision_available,
         model_type=ChatModelOptions.ModelType.ANTHROPIC,
-        attached_files=attached_files,
+        query_files=query_files,
     )
 
     messages, system_prompt = format_messages_for_anthropic(messages, system_prompt)
diff --git a/src/khoj/processor/conversation/google/gemini_chat.py b/src/khoj/processor/conversation/google/gemini_chat.py
index b7a7739f..db6f3c4e 100644
--- a/src/khoj/processor/conversation/google/gemini_chat.py
+++ b/src/khoj/processor/conversation/google/gemini_chat.py
@@ -37,7 +37,7 @@ def extract_questions_gemini(
     query_images: Optional[list[str]] = None,
     vision_enabled: bool = False,
     personality_context: Optional[str] = None,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ):
     """
@@ -84,7 +84,7 @@ def extract_questions_gemini(
         images=query_images,
         model_type=ChatModelOptions.ModelType.GOOGLE,
         vision_enabled=vision_enabled,
-        attached_file_context=attached_files,
+        attached_file_context=query_files,
     )
 
     messages = []
@@ -162,7 +162,7 @@ def converse_gemini(
     agent: Agent = None,
     query_images: Optional[list[str]] = None,
     vision_available: bool = False,
-    attached_files: str = None,
+    query_files: str = None,
     tracer={},
 ):
     """
@@ -221,7 +221,7 @@ def converse_gemini(
         query_images=query_images,
         vision_enabled=vision_available,
         model_type=ChatModelOptions.ModelType.GOOGLE,
-        attached_files=attached_files,
+        query_files=query_files,
     )
 
     messages, system_prompt = format_messages_for_gemini(messages, system_prompt)
diff --git a/src/khoj/processor/conversation/offline/chat_model.py b/src/khoj/processor/conversation/offline/chat_model.py
index 6a25e258..c41c847b 100644
--- a/src/khoj/processor/conversation/offline/chat_model.py
+++ b/src/khoj/processor/conversation/offline/chat_model.py
@@ -37,7 +37,7 @@ def extract_questions_offline(
     max_prompt_size: int = None,
     temperature: float = 0.7,
     personality_context: Optional[str] = None,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ) -> List[str]:
     """
@@ -88,7 +88,7 @@ def extract_questions_offline(
         loaded_model=offline_chat_model,
         max_prompt_size=max_prompt_size,
         model_type=ChatModelOptions.ModelType.OFFLINE,
-        attached_files=attached_files,
+        query_files=query_files,
     )
 
     state.chat_lock.acquire()
@@ -154,7 +154,7 @@ def converse_offline(
     location_data: LocationData = None,
     user_name: str = None,
     agent: Agent = None,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ) -> Union[ThreadedGenerator, Iterator[str]]:
     """
@@ -219,7 +219,7 @@ def converse_offline(
         max_prompt_size=max_prompt_size,
         tokenizer_name=tokenizer_name,
         model_type=ChatModelOptions.ModelType.OFFLINE,
-        attached_files=attached_files,
+        query_files=query_files,
     )
 
     truncated_messages = "\n".join({f"{message.content[:70]}..." for message in messages})
diff --git a/src/khoj/processor/conversation/openai/gpt.py b/src/khoj/processor/conversation/openai/gpt.py
index 70d208d8..c4cb0c67 100644
--- a/src/khoj/processor/conversation/openai/gpt.py
+++ b/src/khoj/processor/conversation/openai/gpt.py
@@ -34,7 +34,7 @@ def extract_questions(
     query_images: Optional[list[str]] = None,
     vision_enabled: bool = False,
     personality_context: Optional[str] = None,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ):
     """
@@ -80,7 +80,7 @@ def extract_questions(
         images=query_images,
         model_type=ChatModelOptions.ModelType.OPENAI,
         vision_enabled=vision_enabled,
-        attached_file_context=attached_files,
+        attached_file_context=query_files,
     )
 
     messages = []
@@ -151,7 +151,7 @@ def converse(
     agent: Agent = None,
     query_images: Optional[list[str]] = None,
     vision_available: bool = False,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ):
     """
@@ -210,7 +210,7 @@ def converse(
         query_images=query_images,
         vision_enabled=vision_available,
         model_type=ChatModelOptions.ModelType.OPENAI,
-        attached_files=attached_files,
+        query_files=query_files,
     )
     truncated_messages = "\n".join({f"{message.content[:70]}..." for message in messages})
     logger.debug(f"Conversation Context for GPT: {truncated_messages}")
diff --git a/src/khoj/processor/conversation/utils.py b/src/khoj/processor/conversation/utils.py
index 7fe83d06..b007be9a 100644
--- a/src/khoj/processor/conversation/utils.py
+++ b/src/khoj/processor/conversation/utils.py
@@ -157,14 +157,14 @@ def construct_chat_history(conversation_history: dict, n: int = 4, agent_name="A
             chat_history += f"User: {chat['intent']['query']}\n"
             chat_history += f"{agent_name}: {chat['intent']['inferred-queries'][0]}\n"
         elif chat["by"] == "you":
-            raw_attached_files = chat.get("attachedFiles")
-            if raw_attached_files:
-                attached_files: Dict[str, str] = {}
-                for file in raw_attached_files:
-                    attached_files[file["name"]] = file["content"]
+            raw_query_files = chat.get("queryFiles")
+            if raw_query_files:
+                query_files: Dict[str, str] = {}
+                for file in raw_query_files:
+                    query_files[file["name"]] = file["content"]
 
-                attached_file_context = gather_raw_attached_files(attached_files)
-                chat_history += f"User: {attached_file_context}\n"
+                query_file_context = gather_raw_query_files(query_files)
+                chat_history += f"User: {query_file_context}\n"
 
     return chat_history
 
@@ -254,7 +254,7 @@ def save_to_conversation_log(
     conversation_id: str = None,
     automation_id: str = None,
     query_images: List[str] = None,
-    raw_attached_files: List[FileAttachment] = [],
+    raw_query_files: List[FileAttachment] = [],
     train_of_thought: List[Any] = [],
     tracer: Dict[str, Any] = {},
 ):
@@ -267,7 +267,7 @@ def save_to_conversation_log(
             "created": user_message_time,
             "images": query_images,
             "turnId": turn_id,
-            "attachedFiles": [file.model_dump(mode="json") for file in raw_attached_files],
+            "queryFiles": [file.model_dump(mode="json") for file in raw_query_files],
         },
         khoj_message_metadata={
             "context": compiled_references,
@@ -330,18 +330,18 @@ def construct_structured_message(
     return message
 
 
-def gather_raw_attached_files(
-    attached_files: Dict[str, str],
+def gather_raw_query_files(
+    query_files: Dict[str, str],
 ):
     """
     Gather contextual data from the given (raw) files
     """
 
-    if len(attached_files) == 0:
+    if len(query_files) == 0:
         return ""
 
     contextual_data = " ".join(
-        [f"File: {file_name}\n\n{file_content}\n\n" for file_name, file_content in attached_files.items()]
+        [f"File: {file_name}\n\n{file_content}\n\n" for file_name, file_content in query_files.items()]
     )
     return f"I have attached the following files:\n\n{contextual_data}"
 
@@ -358,7 +358,7 @@ def generate_chatml_messages_with_context(
     vision_enabled=False,
     model_type="",
     context_message="",
-    attached_files: str = None,
+    query_files: str = None,
 ):
     """Generate chat messages with appropriate context from previous conversation to send to the chat model"""
     # Set max prompt size from user config or based on pre-configured for model and machine specs
@@ -389,13 +389,13 @@ def generate_chatml_messages_with_context(
             )
             message_context += f"{prompts.notes_conversation.format(references=references)}\n\n"
 
-        if chat.get("attachedFiles"):
-            raw_attached_files = chat.get("attachedFiles")
-            attached_files_dict = dict()
-            for file in raw_attached_files:
-                attached_files_dict[file["name"]] = file["content"]
+        if chat.get("queryFiles"):
+            raw_query_files = chat.get("queryFiles")
+            query_files_dict = dict()
+            for file in raw_query_files:
+                query_files_dict[file["name"]] = file["content"]
 
-            message_attached_files = gather_raw_attached_files(attached_files_dict)
+            message_attached_files = gather_raw_query_files(query_files_dict)
             chatml_messages.append(ChatMessage(content=message_attached_files, role="user"))
 
         if not is_none_or_empty(chat.get("onlineContext")):
@@ -407,7 +407,7 @@ def generate_chatml_messages_with_context(
 
         role = "user" if chat["by"] == "you" else "assistant"
         message_content = construct_structured_message(
-            chat["message"], chat.get("images"), model_type, vision_enabled, attached_file_context=attached_files
+            chat["message"], chat.get("images"), model_type, vision_enabled, attached_file_context=query_files
         )
 
         reconstructed_message = ChatMessage(content=message_content, role=role)
@@ -421,7 +421,7 @@ def generate_chatml_messages_with_context(
         messages.append(
             ChatMessage(
                 content=construct_structured_message(
-                    user_message, query_images, model_type, vision_enabled, attached_files
+                    user_message, query_images, model_type, vision_enabled, query_files
                 ),
                 role="user",
             )
diff --git a/src/khoj/processor/image/generate.py b/src/khoj/processor/image/generate.py
index 003dae4d..6c1f71b6 100644
--- a/src/khoj/processor/image/generate.py
+++ b/src/khoj/processor/image/generate.py
@@ -28,7 +28,7 @@ async def text_to_image(
     send_status_func: Optional[Callable] = None,
     query_images: Optional[List[str]] = None,
     agent: Agent = None,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ):
     status_code = 200
@@ -70,7 +70,7 @@ async def text_to_image(
         query_images=query_images,
         user=user,
         agent=agent,
-        attached_files=attached_files,
+        query_files=query_files,
         tracer=tracer,
     )
 
diff --git a/src/khoj/processor/tools/online_search.py b/src/khoj/processor/tools/online_search.py
index c6fbd607..7fdb82d4 100644
--- a/src/khoj/processor/tools/online_search.py
+++ b/src/khoj/processor/tools/online_search.py
@@ -68,7 +68,7 @@ async def search_online(
     query_images: List[str] = None,
     previous_subqueries: Set = set(),
     agent: Agent = None,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ):
     query += " ".join(custom_filters)
@@ -86,7 +86,7 @@ async def search_online(
         query_images=query_images,
         agent=agent,
         tracer=tracer,
-        attached_files=attached_files,
+        query_files=query_files,
     )
     subqueries = list(new_subqueries - previous_subqueries)
     response_dict: Dict[str, Dict[str, List[Dict] | Dict]] = {}
@@ -178,7 +178,7 @@ async def read_webpages(
     query_images: List[str] = None,
     agent: Agent = None,
     max_webpages_to_read: int = DEFAULT_MAX_WEBPAGES_TO_READ,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ):
     "Infer web pages to read from the query and extract relevant information from them"
@@ -190,7 +190,7 @@ async def read_webpages(
         user,
         query_images,
         agent=agent,
-        attached_files=attached_files,
+        query_files=query_files,
         tracer=tracer,
     )
 
diff --git a/src/khoj/processor/tools/run_code.py b/src/khoj/processor/tools/run_code.py
index c4e2ace1..e24b3b53 100644
--- a/src/khoj/processor/tools/run_code.py
+++ b/src/khoj/processor/tools/run_code.py
@@ -36,7 +36,7 @@ async def run_code(
     query_images: List[str] = None,
     agent: Agent = None,
     sandbox_url: str = SANDBOX_URL,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ):
     # Generate Code
@@ -54,7 +54,7 @@ async def run_code(
                 query_images,
                 agent,
                 tracer,
-                attached_files,
+                query_files,
             )
     except Exception as e:
         raise ValueError(f"Failed to generate code for {query} with error: {e}")
@@ -84,7 +84,7 @@ async def generate_python_code(
     query_images: List[str] = None,
     agent: Agent = None,
     tracer: dict = {},
-    attached_files: str = None,
+    query_files: str = None,
 ) -> List[str]:
     location = f"{location_data}" if location_data else "Unknown"
     username = prompts.user_name.format(name=user.get_full_name()) if user.get_full_name() else ""
@@ -112,7 +112,7 @@ async def generate_python_code(
         response_type="json_object",
         user=user,
         tracer=tracer,
-        attached_files=attached_files,
+        query_files=query_files,
     )
 
     # Validate that the response is a non-empty, JSON-serializable list
diff --git a/src/khoj/routers/api.py b/src/khoj/routers/api.py
index 747c7e66..f66fbce8 100644
--- a/src/khoj/routers/api.py
+++ b/src/khoj/routers/api.py
@@ -351,7 +351,7 @@ async def extract_references_and_questions(
     query_images: Optional[List[str]] = None,
     previous_inferred_queries: Set = set(),
     agent: Agent = None,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ):
     user = request.user.object if request.user.is_authenticated else None
@@ -426,7 +426,7 @@ async def extract_references_and_questions(
                 user=user,
                 max_prompt_size=conversation_config.max_prompt_size,
                 personality_context=personality_context,
-                attached_files=attached_files,
+                query_files=query_files,
                 tracer=tracer,
             )
         elif conversation_config.model_type == ChatModelOptions.ModelType.OPENAI:
@@ -445,7 +445,7 @@ async def extract_references_and_questions(
                 query_images=query_images,
                 vision_enabled=vision_enabled,
                 personality_context=personality_context,
-                attached_files=attached_files,
+                query_files=query_files,
                 tracer=tracer,
             )
         elif conversation_config.model_type == ChatModelOptions.ModelType.ANTHROPIC:
@@ -461,7 +461,7 @@ async def extract_references_and_questions(
                 user=user,
                 vision_enabled=vision_enabled,
                 personality_context=personality_context,
-                attached_files=attached_files,
+                query_files=query_files,
                 tracer=tracer,
             )
         elif conversation_config.model_type == ChatModelOptions.ModelType.GOOGLE:
@@ -478,7 +478,7 @@ async def extract_references_and_questions(
                 user=user,
                 vision_enabled=vision_enabled,
                 personality_context=personality_context,
-                attached_files=attached_files,
+                query_files=query_files,
                 tracer=tracer,
             )
 
diff --git a/src/khoj/routers/api_chat.py b/src/khoj/routers/api_chat.py
index bb642267..33476a97 100644
--- a/src/khoj/routers/api_chat.py
+++ b/src/khoj/routers/api_chat.py
@@ -50,7 +50,7 @@ from khoj.routers.helpers import (
     aget_relevant_output_modes,
     construct_automation_created_message,
     create_automation,
-    gather_raw_attached_files,
+    gather_raw_query_files,
     generate_excalidraw_diagram,
     generate_summary_from_files,
     get_conversation_command,
@@ -602,7 +602,7 @@ async def chat(
     country_code = body.country_code or get_country_code_from_timezone(body.timezone)
     timezone = body.timezone
     raw_images = body.images
-    raw_attached_files = body.files
+    raw_query_files = body.files
 
     async def event_generator(q: str, images: list[str]):
         start_time = time.perf_counter()
@@ -614,7 +614,7 @@ async def chat(
         q = unquote(q)
         train_of_thought = []
         nonlocal conversation_id
-        nonlocal raw_attached_files
+        nonlocal raw_query_files
 
         tracer: dict = {
             "mid": turn_id,
@@ -634,10 +634,10 @@ async def chat(
                 if uploaded_image:
                     uploaded_images.append(uploaded_image)
 
-        attached_files: Dict[str, str] = {}
-        if raw_attached_files:
-            for file in raw_attached_files:
-                attached_files[file.name] = file.content
+        query_files: Dict[str, str] = {}
+        if raw_query_files:
+            for file in raw_query_files:
+                query_files[file.name] = file.content
 
         async def send_event(event_type: ChatEvent, data: str | dict):
             nonlocal connection_alive, ttft, train_of_thought
@@ -750,7 +750,7 @@ async def chat(
         compiled_references: List[Any] = []
         inferred_queries: List[Any] = []
         file_filters = conversation.file_filters if conversation and conversation.file_filters else []
-        attached_file_context = gather_raw_attached_files(attached_files)
+        attached_file_context = gather_raw_query_files(query_files)
 
         if conversation_commands == [ConversationCommand.Default] or is_automated_task:
             conversation_commands = await aget_relevant_information_sources(
@@ -760,7 +760,7 @@ async def chat(
                 user=user,
                 query_images=uploaded_images,
                 agent=agent,
-                attached_files=attached_file_context,
+                query_files=attached_file_context,
                 tracer=tracer,
             )
 
@@ -806,7 +806,7 @@ async def chat(
                 user_name=user_name,
                 location=location,
                 file_filters=conversation.file_filters if conversation else [],
-                attached_files=attached_file_context,
+                query_files=attached_file_context,
                 tracer=tracer,
             ):
                 if isinstance(research_result, InformationCollectionIteration):
@@ -855,7 +855,7 @@ async def chat(
                     query_images=uploaded_images,
                     agent=agent,
                     send_status_func=partial(send_event, ChatEvent.STATUS),
-                    attached_files=attached_file_context,
+                    query_files=attached_file_context,
                     tracer=tracer,
                 ):
                     if isinstance(response, dict) and ChatEvent.STATUS in response:
@@ -877,7 +877,7 @@ async def chat(
                 conversation_id=conversation_id,
                 query_images=uploaded_images,
                 train_of_thought=train_of_thought,
-                raw_attached_files=raw_attached_files,
+                raw_query_files=raw_query_files,
                 tracer=tracer,
             )
             return
@@ -923,7 +923,7 @@ async def chat(
                 automation_id=automation.id,
                 query_images=uploaded_images,
                 train_of_thought=train_of_thought,
-                raw_attached_files=raw_attached_files,
+                raw_query_files=raw_query_files,
                 tracer=tracer,
             )
             async for result in send_llm_response(llm_response):
@@ -946,7 +946,7 @@ async def chat(
                     partial(send_event, ChatEvent.STATUS),
                     query_images=uploaded_images,
                     agent=agent,
-                    attached_files=attached_file_context,
+                    query_files=attached_file_context,
                     tracer=tracer,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
@@ -992,7 +992,7 @@ async def chat(
                     custom_filters,
                     query_images=uploaded_images,
                     agent=agent,
-                    attached_files=attached_file_context,
+                    query_files=attached_file_context,
                     tracer=tracer,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
@@ -1018,7 +1018,7 @@ async def chat(
                     partial(send_event, ChatEvent.STATUS),
                     query_images=uploaded_images,
                     agent=agent,
-                    attached_files=attached_file_context,
+                    query_files=attached_file_context,
                     tracer=tracer,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
@@ -1059,7 +1059,7 @@ async def chat(
                     partial(send_event, ChatEvent.STATUS),
                     query_images=uploaded_images,
                     agent=agent,
-                    attached_files=attached_file_context,
+                    query_files=attached_file_context,
                     tracer=tracer,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
@@ -1100,7 +1100,7 @@ async def chat(
                 send_status_func=partial(send_event, ChatEvent.STATUS),
                 query_images=uploaded_images,
                 agent=agent,
-                attached_files=attached_file_context,
+                query_files=attached_file_context,
                 tracer=tracer,
             ):
                 if isinstance(result, dict) and ChatEvent.STATUS in result:
@@ -1134,7 +1134,7 @@ async def chat(
                 query_images=uploaded_images,
                 train_of_thought=train_of_thought,
                 attached_file_context=attached_file_context,
-                raw_attached_files=raw_attached_files,
+                raw_query_files=raw_query_files,
                 tracer=tracer,
             )
             content_obj = {
@@ -1164,7 +1164,7 @@ async def chat(
                 user=user,
                 agent=agent,
                 send_status_func=partial(send_event, ChatEvent.STATUS),
-                attached_files=attached_file_context,
+                query_files=attached_file_context,
                 tracer=tracer,
             ):
                 if isinstance(result, dict) and ChatEvent.STATUS in result:
@@ -1195,7 +1195,7 @@ async def chat(
                 query_images=uploaded_images,
                 train_of_thought=train_of_thought,
                 attached_file_context=attached_file_context,
-                raw_attached_files=raw_attached_files,
+                raw_query_files=raw_query_files,
                 tracer=tracer,
             )
 
@@ -1224,7 +1224,7 @@ async def chat(
             uploaded_images,
             train_of_thought,
             attached_file_context,
-            raw_attached_files,
+            raw_query_files,
             tracer,
         )
 
diff --git a/src/khoj/routers/helpers.py b/src/khoj/routers/helpers.py
index 69f77e91..e645478d 100644
--- a/src/khoj/routers/helpers.py
+++ b/src/khoj/routers/helpers.py
@@ -256,18 +256,18 @@ async def agenerate_chat_response(*args):
     return await loop.run_in_executor(executor, generate_chat_response, *args)
 
 
-def gather_raw_attached_files(
-    attached_files: Dict[str, str],
+def gather_raw_query_files(
+    query_files: Dict[str, str],
 ):
     """
     Gather contextual data from the given (raw) files
     """
 
-    if len(attached_files) == 0:
+    if len(query_files) == 0:
         return ""
 
     contextual_data = " ".join(
-        [f"File: {file_name}\n\n{file_content}\n\n" for file_name, file_content in attached_files.items()]
+        [f"File: {file_name}\n\n{file_content}\n\n" for file_name, file_content in query_files.items()]
     )
     return f"I have attached the following files:\n\n{contextual_data}"
 
@@ -334,7 +334,7 @@ async def aget_relevant_information_sources(
     user: KhojUser,
     query_images: List[str] = None,
     agent: Agent = None,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ):
     """
@@ -372,7 +372,7 @@ async def aget_relevant_information_sources(
             relevant_tools_prompt,
             response_type="json_object",
             user=user,
-            attached_files=attached_files,
+            query_files=query_files,
             tracer=tracer,
         )
 
@@ -482,7 +482,7 @@ async def infer_webpage_urls(
     user: KhojUser,
     query_images: List[str] = None,
     agent: Agent = None,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ) -> List[str]:
     """
@@ -512,7 +512,7 @@ async def infer_webpage_urls(
             query_images=query_images,
             response_type="json_object",
             user=user,
-            attached_files=attached_files,
+            query_files=query_files,
             tracer=tracer,
         )
 
@@ -538,7 +538,7 @@ async def generate_online_subqueries(
     user: KhojUser,
     query_images: List[str] = None,
     agent: Agent = None,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ) -> Set[str]:
     """
@@ -568,7 +568,7 @@ async def generate_online_subqueries(
             query_images=query_images,
             response_type="json_object",
             user=user,
-            attached_files=attached_files,
+            query_files=query_files,
             tracer=tracer,
         )
 
@@ -691,7 +691,7 @@ async def generate_summary_from_files(
     query_images: List[str] = None,
     agent: Agent = None,
     send_status_func: Optional[Callable] = None,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ):
     try:
@@ -701,17 +701,15 @@ async def generate_summary_from_files(
             if len(file_names) > 0:
                 file_objects = await FileObjectAdapters.async_get_file_objects_by_name(None, file_names.pop(), agent)
 
-        if (file_objects and len(file_objects) == 0 and not attached_files) or (
-            not file_objects and not attached_files
-        ):
+        if (file_objects and len(file_objects) == 0 and not query_files) or (not file_objects and not query_files):
             response_log = "Sorry, I couldn't find anything to summarize."
             yield response_log
             return
 
         contextual_data = " ".join([f"File: {file.file_name}\n\n{file.raw_text}" for file in file_objects])
 
-        if attached_files:
-            contextual_data += f"\n\n{attached_files}"
+        if query_files:
+            contextual_data += f"\n\n{query_files}"
 
         if not q:
             q = "Create a general summary of the file"
@@ -754,7 +752,7 @@ async def generate_excalidraw_diagram(
     user: KhojUser = None,
     agent: Agent = None,
     send_status_func: Optional[Callable] = None,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ):
     if send_status_func:
@@ -770,7 +768,7 @@ async def generate_excalidraw_diagram(
         query_images=query_images,
         user=user,
         agent=agent,
-        attached_files=attached_files,
+        query_files=query_files,
         tracer=tracer,
     )
 
@@ -797,7 +795,7 @@ async def generate_better_diagram_description(
     query_images: List[str] = None,
     user: KhojUser = None,
     agent: Agent = None,
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ) -> str:
     """
@@ -839,7 +837,7 @@ async def generate_better_diagram_description(
             improve_diagram_description_prompt,
             query_images=query_images,
             user=user,
-            attached_files=attached_files,
+            query_files=query_files,
             tracer=tracer,
         )
         response = response.strip()
@@ -887,7 +885,7 @@ async def generate_better_image_prompt(
     query_images: Optional[List[str]] = None,
     user: KhojUser = None,
     agent: Agent = None,
-    attached_files: str = "",
+    query_files: str = "",
     tracer: dict = {},
 ) -> str:
     """
@@ -936,7 +934,7 @@ async def generate_better_image_prompt(
 
     with timer("Chat actor: Generate contextual image prompt", logger):
         response = await send_message_to_model_wrapper(
-            image_prompt, query_images=query_images, user=user, attached_files=attached_files, tracer=tracer
+            image_prompt, query_images=query_images, user=user, query_files=query_files, tracer=tracer
         )
         response = response.strip()
         if response.startswith(('"', "'")) and response.endswith(('"', "'")):
@@ -952,7 +950,7 @@ async def send_message_to_model_wrapper(
     user: KhojUser = None,
     query_images: List[str] = None,
     context: str = "",
-    attached_files: str = None,
+    query_files: str = None,
     tracer: dict = {},
 ):
     conversation_config: ChatModelOptions = await ConversationAdapters.aget_default_conversation_config(user)
@@ -992,7 +990,7 @@ async def send_message_to_model_wrapper(
             max_prompt_size=max_tokens,
             vision_enabled=vision_available,
             model_type=conversation_config.model_type,
-            attached_files=attached_files,
+            query_files=query_files,
         )
 
         return send_message_to_model_offline(
@@ -1019,7 +1017,7 @@ async def send_message_to_model_wrapper(
             vision_enabled=vision_available,
             query_images=query_images,
             model_type=conversation_config.model_type,
-            attached_files=attached_files,
+            query_files=query_files,
         )
 
         return send_message_to_model(
@@ -1042,7 +1040,7 @@ async def send_message_to_model_wrapper(
             vision_enabled=vision_available,
             query_images=query_images,
             model_type=conversation_config.model_type,
-            attached_files=attached_files,
+            query_files=query_files,
         )
 
         return anthropic_send_message_to_model(
@@ -1064,7 +1062,7 @@ async def send_message_to_model_wrapper(
             vision_enabled=vision_available,
             query_images=query_images,
             model_type=conversation_config.model_type,
-            attached_files=attached_files,
+            query_files=query_files,
         )
 
         return gemini_send_message_to_model(
@@ -1079,7 +1077,7 @@ def send_message_to_model_wrapper_sync(
     system_message: str = "",
     response_type: str = "text",
     user: KhojUser = None,
-    attached_files: str = "",
+    query_files: str = "",
     tracer: dict = {},
 ):
     conversation_config: ChatModelOptions = ConversationAdapters.get_default_conversation_config(user)
@@ -1104,7 +1102,7 @@ def send_message_to_model_wrapper_sync(
             max_prompt_size=max_tokens,
             vision_enabled=vision_available,
             model_type=conversation_config.model_type,
-            attached_files=attached_files,
+            query_files=query_files,
         )
 
         return send_message_to_model_offline(
@@ -1126,7 +1124,7 @@ def send_message_to_model_wrapper_sync(
             max_prompt_size=max_tokens,
             vision_enabled=vision_available,
             model_type=conversation_config.model_type,
-            attached_files=attached_files,
+            query_files=query_files,
         )
 
         openai_response = send_message_to_model(
@@ -1148,7 +1146,7 @@ def send_message_to_model_wrapper_sync(
             max_prompt_size=max_tokens,
             vision_enabled=vision_available,
             model_type=conversation_config.model_type,
-            attached_files=attached_files,
+            query_files=query_files,
         )
 
         return anthropic_send_message_to_model(
@@ -1168,7 +1166,7 @@ def send_message_to_model_wrapper_sync(
             max_prompt_size=max_tokens,
             vision_enabled=vision_available,
             model_type=conversation_config.model_type,
-            attached_files=attached_files,
+            query_files=query_files,
         )
 
         return gemini_send_message_to_model(
@@ -1199,8 +1197,8 @@ def generate_chat_response(
     meta_research: str = "",
     query_images: Optional[List[str]] = None,
     train_of_thought: List[Any] = [],
-    attached_files: str = None,
-    raw_attached_files: List[FileAttachment] = None,
+    query_files: str = None,
+    raw_query_files: List[FileAttachment] = None,
     tracer: dict = {},
 ) -> Tuple[Union[ThreadedGenerator, Iterator[str]], Dict[str, str]]:
     # Initialize Variables
@@ -1223,7 +1221,7 @@ def generate_chat_response(
             conversation_id=conversation_id,
             query_images=query_images,
             train_of_thought=train_of_thought,
-            raw_attached_files=raw_attached_files,
+            raw_query_files=raw_query_files,
             tracer=tracer,
         )
 
@@ -1258,7 +1256,7 @@ def generate_chat_response(
                 location_data=location_data,
                 user_name=user_name,
                 agent=agent,
-                attached_files=attached_files,
+                query_files=query_files,
                 tracer=tracer,
             )
 
@@ -1284,7 +1282,7 @@ def generate_chat_response(
                 user_name=user_name,
                 agent=agent,
                 vision_available=vision_available,
-                attached_files=attached_files,
+                query_files=query_files,
                 tracer=tracer,
             )
 
@@ -1307,7 +1305,7 @@ def generate_chat_response(
                 user_name=user_name,
                 agent=agent,
                 vision_available=vision_available,
-                attached_files=attached_files,
+                query_files=query_files,
                 tracer=tracer,
             )
         elif conversation_config.model_type == ChatModelOptions.ModelType.GOOGLE:
@@ -1329,7 +1327,7 @@ def generate_chat_response(
                 agent=agent,
                 query_images=query_images,
                 vision_available=vision_available,
-                attached_files=attached_files,
+                query_files=query_files,
                 tracer=tracer,
             )
 
diff --git a/src/khoj/routers/research.py b/src/khoj/routers/research.py
index b9d1fcff..abf8f96c 100644
--- a/src/khoj/routers/research.py
+++ b/src/khoj/routers/research.py
@@ -46,7 +46,7 @@ async def apick_next_tool(
     max_iterations: int = 5,
     send_status_func: Optional[Callable] = None,
     tracer: dict = {},
-    attached_files: str = None,
+    query_files: str = None,
 ):
     """Given a query, determine which of the available tools the agent should use in order to answer appropriately."""
 
@@ -92,7 +92,7 @@ async def apick_next_tool(
                 response_type="json_object",
                 user=user,
                 query_images=query_images,
-                attached_files=attached_files,
+                query_files=query_files,
                 tracer=tracer,
             )
     except Exception as e:
@@ -152,7 +152,7 @@ async def execute_information_collection(
     location: LocationData = None,
     file_filters: List[str] = [],
     tracer: dict = {},
-    attached_files: str = None,
+    query_files: str = None,
 ):
     current_iteration = 0
     MAX_ITERATIONS = 5
@@ -176,7 +176,7 @@ async def execute_information_collection(
             MAX_ITERATIONS,
             send_status_func,
             tracer=tracer,
-            attached_files=attached_files,
+            query_files=query_files,
         ):
             if isinstance(result, dict) and ChatEvent.STATUS in result:
                 yield result[ChatEvent.STATUS]
@@ -207,7 +207,7 @@ async def execute_information_collection(
                 previous_inferred_queries=previous_inferred_queries,
                 agent=agent,
                 tracer=tracer,
-                attached_files=attached_files,
+                query_files=query_files,
             ):
                 if isinstance(result, dict) and ChatEvent.STATUS in result:
                     yield result[ChatEvent.STATUS]
@@ -269,7 +269,7 @@ async def execute_information_collection(
                     query_images=query_images,
                     agent=agent,
                     tracer=tracer,
-                    attached_files=attached_files,
+                    query_files=query_files,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
                         yield result[ChatEvent.STATUS]
@@ -300,7 +300,7 @@ async def execute_information_collection(
                     send_status_func,
                     query_images=query_images,
                     agent=agent,
-                    attached_files=attached_files,
+                    query_files=query_files,
                     tracer=tracer,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
@@ -326,7 +326,7 @@ async def execute_information_collection(
                     query_images=query_images,
                     agent=agent,
                     send_status_func=send_status_func,
-                    attached_files=attached_files,
+                    query_files=query_files,
                 ):
                     if isinstance(result, dict) and ChatEvent.STATUS in result:
                         yield result[ChatEvent.STATUS]