Spaces:

akshaybhure098
/

phi4

Sleeping

akshaybhure098 commited on Feb 26

Commit

9cf4b85

verified ·

1 Parent(s): 3f24b3a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,26 +1,32 @@
-from fastapi import FastAPI
-from pydantic import BaseModel
-from llama_cpp import Llama
-app = FastAPI()
-# Load the model
-llm = Llama.from_pretrained(
-    repo_id="unsloth/phi-4-GGUF",
-    filename="phi-4-Q4_K_M.gguf",
-)
-# Define request model
-class ChatRequest(BaseModel):
-    system_prompt: str
-    query: str
-@app.post("/chat-p4q4")
-async def chat(request: ChatRequest):
-    response = llm.create_chat_completion(
-        messages=[
-            {"role": "system", "content": request.system_prompt},
-            {"role": "user", "content": request.query},
-        ]
-    )
-    return {"response": response}

+from fastapi import FastAPI
+from pydantic import BaseModel
+from llama_cpp import Llama
+app = FastAPI()
+# Load the model
+llm = Llama.from_pretrained(
+    repo_id="unsloth/phi-4-GGUF",
+    filename="phi-4-Q4_K_M.gguf",
+)
+# Define request model
+class ChatRequest(BaseModel):
+    system_prompt: str
+    query: str
+@app.post("/chat-p4q4")
+async def chat(request: ChatRequest):
+    try:
+        response = llm.create_chat_completion(
+            messages=[
+                {"role": "system", "content": request.system_prompt},
+                {"role": "user", "content": request.query},
+            ]
+        )
+        return {"response": response}
+    except Exception as e:
+        # Log the error or print it for debugging
+        print("Error during model inference:", e)
+        return {"error": str(e)}