這是一個基於 Google Gemini API 開發的多功能聊天機器人專案,支援網頁圖形介面 (Gradio) 與終端機 (CLI) 互動模式。本專案具備多輪對話記憶、多模態輸入(圖片、PDF)以及完整的對話紀錄持久化儲存功能。
- 雙介面支持:提供現代化的
Gradio網頁介面 (app.py) 及簡潔高效的CLI互動模式 (chat.py)。 - 強大模型核心:搭載 Google 最新
Gemini 2.5 Flash模型,反應迅速且支援長上下文。 - 多模態對話:支援直接傳送 圖片 (JPG, PNG, WEBP, etc.) 與 PDF 檔案 進行分析、摘要或問答。
- 對話持久化:
- Web 版:自動將每個會話儲存為 JSON,並可隨時載入歷史紀錄繼續對話。
- CLI 版:對話結束後自動產生日期命名的 JSON 紀錄檔。
- 角色切換系統:內建多種 AI 角色(一般助手、程式專家、心靈導師等),並支援自定義 Persona。
- 環境設定簡單:透過
.env檔案管理 API 金鑰,安全且易於設定。
協作者:姚谷伝