Skip to content

Experimental web console for real-time multimodal AI interactions (voice/video) using Gemini 2.0 Live API and NijiVoice. Next.js (TypeScript, Tailwind) frontend and FastAPI backend communicate over WebSocket for low-latency streaming.

Notifications You must be signed in to change notification settings

tetratensor/Realtime-AI-Web-Console

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Realtime AI Web Console

AI とのリアルタイムな対話・音声チャットを行うための Web コンソール。Next.js 製のフロントエンドと、WebSocket 経由でやり取りする FastAPI(Python)製のバックエンドで構成されています。

現時点では Gemini 2.0 Multimodal Live APIにじボイス を組み合わせた実装です。将来的に他プロバイダの追加も容易です。

Features

  • リアルタイム音声・テキスト対話(WebSocket)
  • フロントエンド: Next.js, TypeScript, Tailwind CSS
  • バックエンド: Python, FastAPI, uv, WebSocket
  • CI/CD: GitHub Actions(フロント・バックの CI、バックエンドのデプロイ)

Quick Start

  1. バックエンドを起動(API キーなどの環境変数を設定)
    • 手順: backend/README.md を参照
  2. フロントエンドを起動(バックエンドの URL を設定)
    • 手順: frontend/README.md を参照

各セットアップ手順は以下を参照してください。

About

Experimental web console for real-time multimodal AI interactions (voice/video) using Gemini 2.0 Live API and NijiVoice. Next.js (TypeScript, Tailwind) frontend and FastAPI backend communicate over WebSocket for low-latency streaming.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published