Spaces:

loleg
/

fastapi-apertus

Runtime error

Oleg Lavrovsky commited on Sep 4

Commit

a9c00ee

unverified ·

1 Parent(s): dcc5624

Model clearing

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,6 +9,7 @@ from transformers import AutoModelForCausalLM, AutoTokenizer
 from huggingface_hub import login
 from dotenv import load_dotenv
 import os
 import logging
 # Configure logging
@@ -65,8 +66,9 @@ async def lifespan(app: FastAPI):
         raise e
     # Release resources when the app is stopped
     yield
-    #model.clear()
-    #tokenizer.clear()
 # Setup our app
@@ -130,6 +132,7 @@ async def predict(q: str):
         )
         # Get and decode the output
         output_ids = generated_ids[0][-1]
         logger.debug(output_ids)
         #[len(model_inputs.input_ids[0]) :]

 from huggingface_hub import login
 from dotenv import load_dotenv
 import os
+import uvicorn
 import logging
 # Configure logging
         raise e
     # Release resources when the app is stopped
     yield
+    del model
+    del tokenizer
+    cuda.empty_cache()
 # Setup our app
         )
         # Get and decode the output
+        print(generated_ids)
         output_ids = generated_ids[0][-1]
         logger.debug(output_ids)
         #[len(model_inputs.input_ids[0]) :]