
WhisperDirect: AI文字起こし・議事録
音声、画像、動画 文字起こし。要約、議事録作成。API従量制
無料 · アプリ内課金 · iPad対応
サブスク不要。ご自身のOpenAI APIキーで、使った分だけ支払う圧倒的な低コストを実現。Whisperによる高精度な文字起こし、要約、議事録作成、画像OCRに対応しています。
WhisperDirectは、ご自身のAPIキーで使える高精度の音声文字起こし&要約アプリです。必要なときに必要な分だけOpenAI APIを使う設計なので、サブスク不要で運用できます。
価格と体験
・5回の無料体験があります
・その後は買い切りで、現在の機能を無制限で利用できます
・APIの利用料金はOpenAIに準拠(アプリ側ではAPI利用料を課金しません)
費用の目安
・Whisper API は約 $0.006/分(1時間 ≈ $0.36)
・¥500 で約9.3時間の文字起こしが可能です。(概算 1ドル=¥150の換算、2025年9月時点のOpenAI料金を参考)
・実際の費用は音声の長さや設定により変動します
・OpenAI APIの料金は https://openai.com/ja-JP/api/pricing
をご参照ください
要約・議事録用モデル
・要約/議事録機能で使用するLLMモデルは、
GPT-5 nano / GPT-5 mini / GPT-4.1 nano / GPT-4.1 mini
から選択可能(提供状況により更新される場合があります)
・数千文字規模の日本語テキストでも数円程度の低コストで処理可能です(入力トークン、出力トークンにより変動)
主な機能
・マイクボタンで録音し、そのままテキスト化
・音声ファイルのインポート→テキスト化(共有シート対応)
・動画ファイルの取り込みに対応(音声のみ抽出・圧縮)
・再生位置に合わせて文字起こしを自動ハイライト
・任意間隔のタイムライン挿入(設定で5秒刻みに変更可)
・文字起こし内容から要約を作成
・画像からのOCR文字起こしに対応(複数画像一括処理可)API利用料は発生しません。
・文字起こし内容から議事録を作成(要約・議事録のプロンプトは設定で編集可)
・エクスポート:音声/テキスト/要約/議事録/字幕(VTT / SRT)
・文字起こし・要約・議事録をSlackに自動投稿
・推定コストの表示(音声長・文字数に基づく目安)
・設定画面での細かなカスタマイズ(LLMモデル選択、タイムライン間隔、プロンプトなど)
対応形式
音声: mp3, m4a, aac, wav, flac, ogg, opus, wma, amr, mpga, webm, aiff, caf
動画: mp4, mov, m4v, webm, mkv, avi, mpeg, mpg
注記
・利用にはOpenAI等のAPIキーが必要です
・価格や仕様、利用可能なモデルはOpenAIの提供状況により変更される場合があります
• App Store ページの多言語表示に対応:ドイツ語、フランス語、韓国語、中国語(簡体字/繁体字)の各ストアでの表示を最適化しました。
※アプリ内のインターフェースは英語・日本語のみとなります。
デベロッパである“koji ozono”は、アプリのプライバシー慣行に、以下のデータの取り扱いが含まれる可能性があることを示しました。詳しくは、 デベロッパプライバシーポリシー を参照してください。
データの収集なし
デベロッパはこのアプリからデータを収集しません。
アクセシビリティ
デベロッパは、このアプリがサポートしているアクセシビリティ機能をまだ示していません。 詳しい情報
情報
- 販売元
- koji ozono
- サイズ
- 34.9 MB
- カテゴリ
- 仕事効率化
- 互換性
iOS 17.0以降が必要です。
- iPhone
iOS 17.0以降が必要です。 - iPad
iPadOS 17.0以降が必要です。 - Mac
macOS 14.0以降とApple M1以降のチップを搭載したMacが必要です。 - Apple Vision
visionOS 1.0以降が必要です。
- 言語
- 日本語と英語
- 年齢制限
4+
- 4+
- アプリ内課金
あり
- フルバージョンのアンロック ¥500
- 著作権
- © 2025 Koji Ozono