Spaces:

AlserFurma
/

LipSyncAI

Running

App Files Files Community

AlserFurma commited on 14 days ago

Commit

165135e

verified ·

1 Parent(s): 80564a8

Update app.py

Browse files

Files changed (1) hide show

app.py +113 -38

app.py CHANGED Viewed

@@ -158,15 +158,12 @@ def make_talking_head(image_path: str, audio_path: str, max_retries=3):
 # Основные обработчики для Gradio
 # =========================
 def start_lesson(image: Image.Image, text: str, state):
-    """Шаг 1: генерируем видео-лекцию с вопросом и вариантами ответа."""
     if image is None or not text.strip() or len(text) > 500:
-        return None, "", [], [], state
     try:
-        question, options, correct = generate_quiz(text)
-        quiz_ru = f"Вопрос: {question} Варианты: 1) {options[0]} 2) {options[1]}"
-        audio_path = synthesize_audio(quiz_ru)
         tmpimg = tempfile.NamedTemporaryFile(suffix='.png', delete=False)
         if image.mode != 'RGB':
             image = image.convert('RGB')
@@ -174,38 +171,85 @@ def start_lesson(image: Image.Image, text: str, state):
         tmpimg.close()
         image_path = tmpimg.name
         video_path = make_talking_head(image_path, audio_path)
-        state_data = {'image_path': image_path, 'correct': correct, 'options': options}
-        # удаляем временный аудио файл
         try:
             os.remove(audio_path)
         except:
             pass
-        return video_path, question, gr.Button(options[0], visible=True), gr.Button(options[1], visible=True), state_data
     except Exception as e:
         traceback.print_exc()
-        return None, f"Ошибка: {e}", gr.Button("Вариант 1", visible=True), gr.Button("Вариант 2", visible=True), state
 def answer_selected(selected_option: str, state):
-    """Шаг 2: пользователь выбирает вариант — генерируем реакцию лектора."""
     if not state:
-        return None, "Ошибка: отсутствует состояние урока. Сначала нажмите 'Запустить урок'."
     try:
         correct = state.get('correct')
         image_path = state.get('image_path')
-        options = state.get('options', [])
         if selected_option == correct:
-            reaction_ru = "Молодец!"
-            display_message = "Дұрыс!"
         else:
             reaction_ru = f"Неправильно. Правильный ответ: {correct}"
-            display_message = f"Қате. Дұрыс жауап: {correct}"
         audio_path = synthesize_audio(reaction_ru)
         reaction_video = make_talking_head(image_path, audio_path)
@@ -219,7 +263,7 @@ def answer_selected(selected_option: str, state):
     except Exception as e:
         traceback.print_exc()
-        return None, f"Ошибка: {e}"
 # =========================
@@ -227,46 +271,77 @@ def answer_selected(selected_option: str, state):
 # =========================
 title = "🎓 Интерактивный бейне-лектор"
 description = (
-    "Загрузите фото лектора и текст лекции (русский, до 500 символов). "
-    "Система создаст видео-лектора, задаст вопрос и предложит 2 варианта ответа. "
-    "Нажмите на один из вариантов — лектор коротко отреагирует (қазақша)."
 )
-with gr.Blocks() as demo:
     gr.Markdown(f"# {title}\n{description}")
     with gr.Row():
         with gr.Column(scale=1):
             inp_image = gr.Image(type='pil', label='📸 Фото лектора')
-            inp_text = gr.Textbox(lines=5, label='📝 Текст лекции (рус.)', placeholder='Введите текст...')
-            btn_start = gr.Button("Запустить урок")
         with gr.Column(scale=1):
             out_video = gr.Video(label='🎬 Видео лектора')
-            out_question = gr.Markdown(label='Вопрос')
-            btn_opt1 = gr.Button("Вариант 1")
-            btn_opt2 = gr.Button("Вариант 2")
-            out_reaction_video = gr.Video(label='🎥 Реакция лектора')
-            out_status = gr.Textbox(label='ℹ️ Статус', interactive=False)
     lesson_state = gr.State({})
-    # Привязки
     btn_start.click(
         fn=start_lesson,
         inputs=[inp_image, inp_text, lesson_state],
-        outputs=[out_video, out_question, btn_opt1, btn_opt2, lesson_state]
     )
-    btn_opt1.click(fn=lambda state: answer_selected(state.get('options', [''])[0] if state else '', state),
-                   inputs=[lesson_state],
-                   outputs=[out_reaction_video, out_status])
-    btn_opt2.click(fn=lambda state: answer_selected(state.get('options', [''])[1] if state and len(state.get('options', [])) > 1 else '', state),
-                   inputs=[lesson_state],
-                   outputs=[out_reaction_video, out_status])
-    demo.load(lambda: "Готово", outputs=out_status)
 if __name__ == '__main__':
     demo.launch(server_name="0.0.0.0", server_port=7860)

 # Основные обработчики для Gradio
 # =========================
 def start_lesson(image: Image.Image, text: str, state):
+    """Шаг 1: лектор читает текст лекции."""
     if image is None or not text.strip() or len(text) > 500:
+        return None, "Пожалуйста, загрузите фото и введите текст лекции (до 500 символов)", gr.update(visible=False), state
     try:
+        # Сохраняем изображение
         tmpimg = tempfile.NamedTemporaryFile(suffix='.png', delete=False)
         if image.mode != 'RGB':
             image = image.convert('RGB')
         tmpimg.close()
         image_path = tmpimg.name
+        # Генерируем вопрос заранее (но не озвучиваем)
+        question, options, correct = generate_quiz(text)
+        # Лектор читает текст лекции
+        audio_path = synthesize_audio(text)
         video_path = make_talking_head(image_path, audio_path)
+        # Сохраняем состояние
+        state_data = {
+            'image_path': image_path,
+            'correct': correct,
+            'options': options,
+            'question': question,
+            'text': text
+        }
+        # Удаляем временный аудио файл
         try:
             os.remove(audio_path)
         except:
             pass
+        return video_path, "✅ Лекция прочитана. Нажмите 'Задать вопрос' для проверки знаний.", gr.update(visible=True), state_data
     except Exception as e:
         traceback.print_exc()
+        return None, f"❌ Ошибка: {e}", gr.update(visible=False), state
+def ask_question(state):
+    """Шаг 2: лектор задает вопрос с вариантами ответа."""
+    if not state:
+        return None, "❌ Ошибка: сначала запустите урок", gr.update(visible=False), gr.update(visible=False)
+    try:
+        image_path = state.get('image_path')
+        question = state.get('question')
+        options = state.get('options', [])
+        # Формируем текст вопроса с вариантами
+        quiz_text = f"{question}. Первый вариант: {options[0]}. Второй вариант: {options[1]}"
+        # Генерируем аудио и видео с вопросом
+        audio_path = synthesize_audio(quiz_text)
+        video_path = make_talking_head(image_path, audio_path)
+        # Удаляем временный аудио файл
+        try:
+            os.remove(audio_path)
+        except:
+            pass
+        return (
+            video_path,
+            f"**Вопрос:** {question}",
+            gr.update(value=options[0], visible=True),
+            gr.update(value=options[1], visible=True)
+        )
+    except Exception as e:
+        traceback.print_exc()
+        return None, f"❌ Ошибка: {e}", gr.update(visible=False), gr.update(visible=False)
 def answer_selected(selected_option: str, state):
+    """Шаг 3: пользователь выбирает вариант — генерируем реакцию лектора."""
     if not state:
+        return None, "❌ Ошибка: отсутствует состояние урока"
     try:
         correct = state.get('correct')
         image_path = state.get('image_path')
         if selected_option == correct:
+            reaction_ru = "Правильно! Молодец!"
+            display_message = "✅ Дұрыс! Жарайсың!"
         else:
             reaction_ru = f"Неправильно. Правильный ответ: {correct}"
+            display_message = f"❌ Қате. Дұрыс жауап: {correct}"
         audio_path = synthesize_audio(reaction_ru)
         reaction_video = make_talking_head(image_path, audio_path)
     except Exception as e:
         traceback.print_exc()
+        return None, f"❌ Ошибка: {e}"
 # =========================
 # =========================
 title = "🎓 Интерактивный бейне-лектор"
 description = (
+    "**Как работает:**\n"
+    "1. Загрузите фото лектора и введите текст лекции (русский, до 500 символов)\n"
+    "2. Нажмите 'Запустить урок' — лектор прочитает текст\n"
+    "3. Нажмите 'Задать вопрос' — лектор задаст вопрос с двумя вариантами ответа\n"
+    "4. Выберите правильный ответ — лектор отреагирует на қазақша"
 )
+with gr.Blocks(theme=gr.themes.Soft()) as demo:
     gr.Markdown(f"# {title}\n{description}")
     with gr.Row():
         with gr.Column(scale=1):
             inp_image = gr.Image(type='pil', label='📸 Фото лектора')
+            inp_text = gr.Textbox(
+                lines=5,
+                label='📝 Текст лекции (рус.)',
+                placeholder='Введите текст лекции...',
+                info="Максимум 500 символов"
+            )
+            btn_start = gr.Button("🚀 Запустить урок", variant="primary")
+            btn_question = gr.Button("❓ Задать вопрос", visible=False, variant="secondary")
         with gr.Column(scale=1):
             out_video = gr.Video(label='🎬 Видео лектора')
+            out_status = gr.Markdown("ℹ️ Загрузите фото и текст, затем нажмите 'Запустить урок'")
+            with gr.Row():
+                btn_opt1 = gr.Button("Вариант 1", visible=False, size="lg")
+                btn_opt2 = gr.Button("Вариант 2", visible=False, size="lg")
+            out_reaction_video = gr.Video(label='🎥 Реакция лектора', visible=False)
+            out_result = gr.Markdown("")
     lesson_state = gr.State({})
+    # Шаг 1: Запуск урока (чтение текста)
     btn_start.click(
         fn=start_lesson,
         inputs=[inp_image, inp_text, lesson_state],
+        outputs=[out_video, out_status, btn_question, lesson_state]
     )
+    # Шаг 2: Задать вопрос
+    btn_question.click(
+        fn=ask_question,
+        inputs=[lesson_state],
+        outputs=[out_video, out_status, btn_opt1, btn_opt2]
+    )
+    # Шаг 3: Обработка ответов
+    def handle_answer_1(state):
+        option = state.get('options', [''])[0] if state else ''
+        video, msg = answer_selected(option, state)
+        return video, msg, gr.update(visible=True)
+    def handle_answer_2(state):
+        option = state.get('options', [''])[1] if state and len(state.get('options', [])) > 1 else ''
+        video, msg = answer_selected(option, state)
+        return video, msg, gr.update(visible=True)
+    btn_opt1.click(
+        fn=handle_answer_1,
+        inputs=[lesson_state],
+        outputs=[out_reaction_video, out_result, out_reaction_video]
+    )
+    btn_opt2.click(
+        fn=handle_answer_2,
+        inputs=[lesson_state],
+        outputs=[out_reaction_video, out_result, out_reaction_video]
+    )
 if __name__ == '__main__':
     demo.launch(server_name="0.0.0.0", server_port=7860)