Dự án này cung cấp một API mạnh mẽ để tương tác với các mô hình AI (Gemini, Pollinations, MiMo, LLM7, v.v.) và tích hợp tính năng Chuyển đổi văn bản thành giọng nói (TTS) đa nền tảng chất lượng cao cho Website và Ứng dụng.
Dùng một dòng lệnh duy nhất để tự động hóa toàn bộ quy trình: Tải mã nguồn, cài hệ thống phụ thuộc, thiết lập môi trường ảo (venv), cài đặt dịch vụ chạy ngầm và cấu hình Firewall.
Hỗ trợ: macOS, Ubuntu (Debian), CentOS (RHEL).
curl -sSL https://raw.githubusercontent.com/aiautotool/aiagent/main/quick_install.sh | bash- Đa dạng Model: Hỗ trợ 5 models AI khác nhau:
- Gemini: Google Gemini 2.0 Flash (Mặc định)
- Custom-Gemini: Gemini với cấu hình server riêng
- Pollinations: Pollinations AI
- MiMo: Xiaomi MiMo
- LLM7: LLM7 Model
- Smart Fallback: Tự động chuyển đổi model khác nếu model hiện tại gặp lỗi hoặc rate limit.
- Load Balancing: Hỗ trợ nhiều API Key cùng lúc, tự động xoay vòng để tối ưu hiệu suất.
- Customizable: Tùy chỉnh
temperature,max_tokensvà đặc biệt làsystem_promptđể định hình tính cách AI.
- Đa Engine:
native: Sử dụng giọng offline của hệ điều hành (macOSsay, Linux/Windowsespeak/sapi5).gtts: Sử dụng Google Text-to-Speech (Online) cho giọng tự nhiên hơn.
- Tùy chỉnh cao: Điều chỉnh tốc độ (
rate), âm lượng (volume), và chọn giọng đọc (voice_id). - Base64 Output: Trả về dữ liệu âm thanh dạng Base64, cực kỳ dễ dàng để phát trên trình duyệt hoặc mobile app mà không cần lưu file.
- CORS Enabled: Tích hợp sẵn Cross-Origin Resource Sharing, cho phép gọi API từ bất kỳ domain nào (Frontend, Mobile App).
- Author Selection: Thuật toán tự động chọn tác giả phù hợp cho bài viết từ danh sách 46 persona có sẵn.
- Text Processing: Các tiện ích xử lý văn bản như
slugify,strip_blog_tagsđược tích hợp sẵn. - Web Interface: Giao diện test trực quan cho cả TTS và AI Generation.
Sau khi cài đặt, bạn cần nhập API Key vào config.json để các mô hình AI hoạt động tối ưu.
nano ~/aiagent/config.jsonBạn có thể cung cấp một danh sách các key, hệ thống sẽ tự động chọn ngẫu nhiên:
{
"port": 15005,
"gemini_keys": [
"AIzaSyD...",
"AIzaSyE...",
"AIzaSyF..."
],
"mimo_key": "sk-...",
"custom_gemini_key": "sk-demo"
}Xem hướng dẫn chi tiết đầy đủ tại: API_GUIDE.md
Hệ thống tích hợp sẵn giao diện trực quan để kiểm tra:
- TTS Test: http://localhost:15005/
- AI Test: http://localhost:15005/test_generate.html
- Kiểm tra trạng thái: http://localhost:15005/ (GET request)
- URL:
POST /api/generate - Body:
{
"prompt": "Viết một bài thơ về Hà Nội",
"model": "gemini",
"system_prompt": "Bạn là nhà thơ lãng mạn",
"temperature": 0.8
}- URL:
POST /api/tts - Body:
{
"text": "Xin chào mọi người",
"engine": "gtts",
"voice_id": "vi"
}| Lệnh | Mô tả |
|---|---|
./manage.sh start |
Khởi động dịch vụ |
./manage.sh stop |
Dừng dịch vụ |
./manage.sh restart |
Khởi động lại (cần thiết khi đổi config) |
./manage.sh logs |
Xem log thời gian thực |
./update.sh |
Cập nhật lên phiên bản mới nhất |
- Môi trường biệt lập: Tự động sử dụng
python3-venv. - An toàn: Config file nằm trong
.gitignore, không lo lộ Key khi push code. - Tự động mở Port: Hỗ trợ mở port 15005 trên
ufw,firewalld,iptables. - Đa nền tảng: Chạy tốt trên macOS, Linux, Windows (WSL).
Phát triển bởi AIAUTOTOOL.