Spaces:

Mungert
/

GradLLM

Running

App Files Files Community

johnbridges commited on Aug 16

Commit

bf707d2

1 Parent(s): 6195aba

.

Browse files

Files changed (2) hide show

oa_server.py +3 -30
openai_backend.py +104 -0

oa_server.py CHANGED Viewed

@@ -4,6 +4,7 @@ import json, time, uuid, logging
 from typing import Any, Dict, List, AsyncIterable, Optional
 from rabbit_repo import RabbitRepo
 logger = logging.getLogger(__name__)
@@ -22,34 +23,6 @@ def _last_user_text(messages: List[Dict[str, Any]]) -> str:
                 return " ".join([t for t in texts if t])
     return ""
-# ------------------ backends (replace later) ------------------
-class ChatBackend:
-    async def stream(self, request: Dict[str, Any]) -> AsyncIterable[Dict[str, Any]]:
-        raise NotImplementedError
-class DummyChatBackend(ChatBackend):
-    async def stream(self, request: Dict[str, Any]) -> AsyncIterable[Dict[str, Any]]:
-        rid   = f"chatcmpl-{uuid.uuid4().hex[:12]}"
-        model = request.get("model", "gpt-4o-mini")
-        text  = _last_user_text(request.get("messages", [])) or "(empty)"
-        out   = f"Echo (Rabbit): {text}"
-        now   = _now()
-        # role delta
-        yield {"id": rid, "object":"chat.completion.chunk", "created": now, "model": model,
-               "choices":[{"index":0,"delta":{"role":"assistant"},"finish_reason":None}]}
-        # content deltas
-        for piece in _chunk_text(out, 140):
-            yield {"id": rid, "object":"chat.completion.chunk", "created": now, "model": model,
-                   "choices":[{"index":0,"delta":{"content":piece},"finish_reason":None}]}
-        # final delta
-        yield {"id": rid, "object":"chat.completion.chunk", "created": now, "model": model,
-               "choices":[{"index":0,"delta":{},"finish_reason":"stop"}]}
-class ImagesBackend:
-    async def generate_b64(self, request: Dict[str, Any]) -> str:
-        # 1x1 transparent PNG (stub)
-        return "iVBORw0KGgoAAAANSUhEUgAAAAEAAAABCAQAAAC1HAwCAAAAC0lEQVR4nGP4BwQACfsD/etCJH0AAAAASUVORK5CYII="
 # ------------------ handler class ------------------
 class OpenAIServers:
@@ -63,8 +36,8 @@ class OpenAIServers:
                  *, chat_backend: Optional[ChatBackend] = None,
                     images_backend: Optional[ImagesBackend] = None):
         self._pub = publisher
-        self._chat = chat_backend or DummyChatBackend()
-        self._img  = images_backend or ImagesBackend()
     # -------- Chat Completions --------
     async def handle_chat_create(self, data: Dict[str, Any]) -> None:

 from typing import Any, Dict, List, AsyncIterable, Optional
 from rabbit_repo import RabbitRepo
+from openai_backend import OpenAICompatChatBackend, OpenAIImagesBackend
 logger = logging.getLogger(__name__)
                 return " ".join([t for t in texts if t])
     return ""
 # ------------------ handler class ------------------
 class OpenAIServers:
                  *, chat_backend: Optional[ChatBackend] = None,
                     images_backend: Optional[ImagesBackend] = None):
         self._pub = publisher
+        self._chat = chat_backend or OpenAICompatChatBackend()
+        self._img  = images_backend or OpenAIImagesBackend()
     # -------- Chat Completions --------
     async def handle_chat_create(self, data: Dict[str, Any]) -> None:

openai_backend.py ADDED Viewed

	@@ -0,0 +1,104 @@

+# openai_backend.py
+from __future__ import annotations
+import os, json, base64, logging, asyncio
+from typing import Any, AsyncIterable, Dict, Optional
+from openai import AsyncOpenAI
+from openai._types import NOT_GIVEN
+from config import settings
+from oa_server import ChatBackend, ImagesBackend  # reuse your ABCs
+log = logging.getLogger(__name__)
+def _pick_api_key() -> str:
+    # Use HF/OpenAI-compatible key first (from appsettings → env), else OPENAI_API_KEY
+    return (
+        (getattr(settings, "LlmHFKey", None) or os.getenv("LlmHFKey")) or
+        (getattr(settings, "OpenAIApiKey", None) or os.getenv("OpenAIApiKey")) or
+        os.getenv("OPENAI_API_KEY", "")
+    )
+def _pick_base_url() -> Optional[str]:
+    # If you’ve configured a custom OpenAI-compatible endpoint (e.g. Novita), use it.
+    url = getattr(settings, "LlmHFUrl", None) or os.getenv("LlmHFUrl")
+    return url or None
+def _pick_default_model(incoming: Dict[str, Any]) -> str:
+    # Honor request.model, else prefer HF model id, else OpenAI model from config.
+    return (
+        incoming.get("model")
+        or getattr(settings, "LlmHFModelID", None)
+        or getattr(settings, "LlmGptModel", "gpt-4o-mini")
+    )
+class OpenAICompatChatBackend(ChatBackend):
+    """
+    Streams Chat Completions from any OpenAI-compatible server.
+    - Passes 'tools'/'tool_choice' straight through (function-calling).
+    - Accepts multimodal 'messages[*].content' with text+image_url.
+    - Streams ChatCompletionChunk objects; we convert to plain dicts.
+    """
+    def __init__(self):
+        api_key  = _pick_api_key()
+        base_url = _pick_base_url()
+        if not api_key:
+            log.warning("No API key found; requests will fail.")
+        self.client = AsyncOpenAI(api_key=api_key, base_url=base_url)
+    async def stream(self, request: Dict[str, Any]) -> AsyncIterable[Dict[str, Any]]:
+        # Strip our internal fields; forward only OpenAI payload
+        req = dict(request)
+        req.pop("reply_key", None)  # handled by the caller
+        # Ensure streaming on the provider, even if caller omitted it
+        req.setdefault("stream", True)
+        req.setdefault("model", _pick_default_model(req))
+        # Some providers don’t like unknown keys; drop obviously non-OpenAI keys defensively
+        for k in ("ExchangeName", "FuncName", "MessageTimeout", "RoutingKeys"):
+            req.pop(k, None)
+        # OpenAI SDK returns an async iterator of ChatCompletionChunk
+        stream = await self.client.chat.completions.create(**req)  # stream=True above
+        async for chunk in stream:
+            # Convert to plain dict for serialization over MQ
+            if hasattr(chunk, "model_dump_json"):
+                yield json.loads(chunk.model_dump_json())
+            elif hasattr(chunk, "to_dict"):
+                yield chunk.to_dict()
+            else:
+                yield chunk  # already a dict
+class OpenAIImagesBackend(ImagesBackend):
+    """
+    Generates base64 images via OpenAI-compatible Images API.
+    """
+    def __init__(self):
+        api_key  = _pick_api_key()
+        base_url = _pick_base_url()
+        self.client = AsyncOpenAI(api_key=api_key, base_url=base_url)
+    async def generate_b64(self, request: Dict[str, Any]) -> str:
+        # Expect OpenAI 'images.generate' style fields
+        #  - model (required by most providers)
+        #  - prompt / or 'prompt' inside request['prompt']
+        #  - size like '1024x1024'
+        model = request.get("model") or getattr(settings, "LlmHFModelID", None) or "gpt-image-1"
+        size  = request.get("size", "1024x1024")
+        n     = int(request.get("n", 1))
+        resp = await self.client.images.generate(
+            model=model,
+            prompt=request.get("prompt", ""),
+            size=size,
+            n=n,
+            # If upstream sends 'background' or 'transparent_background', pass-through if supported:
+            background=request.get("background") if "background" in request else NOT_GIVEN,
+            transparent_background=request.get("transparent_background") if "transparent_background" in request else NOT_GIVEN,
+        )
+        # Return first image b64
+        data0 = resp.data[0]
+        if hasattr(data0, "b64_json") and data0.b64_json:
+            return data0.b64_json
+        # Some providers return URLs; fetch is out-of-scope here—return placeholder
+        log.warning("Images API returned URL instead of b64; returning 1x1 transparent pixel.")
+        return "iVBORw0KGgoAAAANSUhEUgAAAAEAAAABCAQAAAC1HAwCAAAAC0lEQVR4nGP4BwQACfsD/etCJH0AAAAASUVORK5CYII="