This application is a web application created using Flask, designed to convert audio files into text. The function to convert to text utilizes OpenAI's Whisper. Whisper has both a free open-source version and a paid API version. This tool uses the API version. As of June 1, 2023, the cost is $0.006 per minute of audio data. For more details, please see here.
-
Language selection: The application supports both Japanese and English.
-
File upload: Users can upload audio files and have their contents converted into text.
-
Audio transcription: The application transcribes the uploaded audio files into text.
-
Display of results: The results of the conversion are displayed on the website.
-
Authentication: The application uses HTTP authentication.
-
Clone this repository.
-
Run
pip install -r requirements.txtto install the required packages. -
Create a config.py file using config_TEMPLATE.py as a reference, and set the username and password (this username and password will be used for accessing the app). You will need API keys for OpenAI. More information on how to get API keys can be found here.
-
To run the application, execute
python app.py.
Contributions to this project are most welcome. Feel free to participate in any form, whether it be bug reports, feature suggestions, or pull requests.
This project is published under the MIT license. For more information, please click here.
ーーーーーーー
このアプリケーションは、Flaskを用いて制作された、オーディオファイルをテキストに変換するためのWebアプリケーションです。テキストに変換する機能はOpenAIのWhisperを活用しています。Whisperには無料のオープンソース版と有料のAPI版がありますが、このツールはAPI版を使用しています。2023年6月1日現在、費用はオーディオデータ1分あたり0.006米ドルです。詳しくはこちらをご覧ください。
-
言語選択: アプリケーションは日本語と英語をサポートしています。
-
ファイルのアップロード: ユーザーはオーディオファイルをアップロードして、その内容をテキストに変換することができます。
-
オーディオのトランスクリプション: アプリケーションはアップロードされたオーディオファイルをテキストに変換します。
-
結果の表示: 変換結果は、ウェブサイト上で表示されます。
-
認証: アプリケーションはHTTP認証を使用します。
-
このリポジトリをクローンします。
-
pip install -r requirements.txtを実行して必要なパッケージをインストールします。 -
config_TEMPLATE.pyを参考にconfig.pyファイルを作成し、ユーザー名とパスワードを設定します(このユーザー名とパスワードは、アプリへのアクセスに使用されます)。OpenAIのAPI keyの取得方法はこちらをご参照ください。
-
アプリケーションを実行するために、
python app.pyを実行します。
このプロジェクトへの貢献は大歓迎です。バグ報告、機能提案、プルリクエストなど、どんな形でもお気軽にご参加ください。
このプロジェクトはMITライセンスのもとに公開されています。詳細はこちらをご覧ください。