From 1916185f19866cec7710c95a7b1111289a9f77f6 Mon Sep 17 00:00:00 2001
From: Andrei Stoica <andrei.stoica.365@gmail.com>
Date: Mon, 26 Feb 2024 11:52:13 -0500
Subject: [PATCH] cleaning up backend sins now

---
 speech-speech/backend/api.py | 18 ++++++------------
 1 file changed, 6 insertions(+), 12 deletions(-)

diff --git a/speech-speech/backend/api.py b/speech-speech/backend/api.py
index eda2815..32a6c7f 100644
--- a/speech-speech/backend/api.py
+++ b/speech-speech/backend/api.py
@@ -1,8 +1,8 @@
 from openai import OpenAI
 from fastapi import FastAPI, File, Response, Request
 from fastapi.middleware.cors import CORSMiddleware
-from fastapi.responses import FileResponse
 from pydantic import BaseModel
+from io import BytesIO
 
 
 app = FastAPI()
@@ -26,22 +26,20 @@ class Conversation(BaseModel):
 
 
 @app.post("/get-text")
-def stt(audio: bytes = File()):
-    with open("audio.webm", "wb+") as f:
-        f.write(audio)
+async def stt(audio: bytes = File()):
+    with BytesIO(audio) as f:
+        f.name = "audio.mp3"
         transcript = openAI_clinet.audio.transcriptions.create(
             model="whisper-1",
             file=f,
             response_format="text",
-         )
+        )
     data = {"len": len(audio), "user-transcript": transcript}
     return data
 
 
 @app.post("/conversation")
 async def get_next_response(request: Request):
-    # role = "test"
-    # res_msg = "temp test response"
     messages = await request.json()
     res = openAI_clinet.chat.completions.create(
         model="gpt-3.5-turbo",
@@ -57,10 +55,6 @@ async def get_next_response(request: Request):
 @app.get("/speak")
 def tts(text: str):
     res = openAI_clinet.audio.speech.create(
-        model="tts-1",
-        voice="nova",
-        input=text,
-        response_format='mp3'
+        model="tts-1", voice="nova", input=text, response_format="mp3"
     )
-    # this works for now but I need to find a way to stream this to response
     return Response(content=res.content, media_type="audio/mp3")