👤 3,439 total uses◯ Free: 5 uses/day • Resets in 11h 46m

音声文字起こし

音声を正確で読みやすいテキストに変換します。MP3、WAV、M4A、WebM、OGG、FLAC、MP4 をアップロード(最大 25 MB)— OpenAI Whisper 搭載。50 以上の言語を自動検出。会議、インタビュー、ポッドキャスト、講義、音声メモに対応。

もっと知る

Audio Transcriberは、OpenAI Whisperを使って音声録音をクリーンで読みやすいテキストに変換します。会議、インタビュー、ポッドキャスト、講義、ボイスメモをMP3、WAV、M4A、WebM、OGG、FLAC、MP4形式でアップロードすると、コピーまたはダウンロードできる正確な文字起こしが得られます。言語は数十言語にわたって自動検出されるため、ジャーナリスト、学生、ポッドキャスター、音声の書面記録を素早く必要とするすべての人に最適です。

ここに音声ファイルをドロップしてください
またはクリックして選択 — MP3、WAV、M4A、WebM、OGG、FLAC、MP4(最大25 MB)
Recommended for long inputs (>60s). You'll get a link as soon as it's ready.

✓ 無料で利用可能 — 登録不要、クレジットカード不要。

フリーランサー

30秒のボイスメモ

手軽な音声メモ → 個人用の検索可能テキストに変換

入力と出力のプレビューを見る

入力

File
voice-memo-2026-05-14.m4a (28s)
Language
en
Speaker Labels
no
Timestamps
no

出力(抜粋)

明日のクライアントコールがあるので、Q2レポートとFigmaからの新しい価格階層モックを取得し、テスト課金のためにStripeのWebhookが実際に発火したか確認する必要があります。また、朝9時までにMariaにSOC2チェックリストを送るのを忘れないでください — 彼女はベンダー質問票で手が止まっていると言っていました。
マーケター

タイムスタンプ付きポッドキャストクリップ

ポッドキャストの抜粋 → ニュースレターやブログ用の引用可能な文字起こし

入力と出力のプレビューを見る

入力

File
lex-friedman-altman-clip.mp3 (4m 12s)
Language
en
Speaker Labels
yes
Timestamps
yes

出力(抜粋)

[00:00] HOST: …それで『AGI』と言うとき、今年はどの定義で考えていますか?
[00:09] GUEST: 大部分の知的作業を有能なプロフェッショナルと同等に、エンドツーエンドで実行できるシステムで、味覚や判断が必要な部分も含みます。
[00:24] HOST: 2年前と比べてかなり厳密な定義ですね。
[00:30] GUEST: そうです。2年前なら汎用性についてもっと語っていたでしょう。今は、市場性があり有用なテストは経済的なものだと考えています — 仕事を任せられるかどうかです。
[00:50] HOST: それで、どれくらい近づいていますか?
スモールビジネス

チームミーティング → アクション項目

非同期スタンドアップ → チーム全体に割り当て可能なアクションリスト

入力と出力のプレビューを見る

入力

File
weekly-standup-2026-05-19.mp3 (18m)
Language
en
Speaker Labels
yes
Timestamps
no
Post Process
extract_action_items

出力(抜粋)

概要: Q3ロードマップが確定し、分析システムの再構築は8月に延期、採用はSeries A完了まで凍結。

アクション項目:
- Sara: 水曜日までに投資家向けに改訂版Q3ロードマップを送付。
- Tomas: 新しい分析ウェアハウスの選定(Snowflake vs ClickHouse)をスパイクし、5月26日までにレポート作成。
- Priya: 月曜終業時までに#general向けの採用停止コミュニケーションを草案。
- Marcus: 請求エンジニアとStripeポータルのローンチ日程を確認。
- 未解決の質問: v1リファラルフローを価格再リリースの前に終了するか、後にするか?

音声文字起こし の結果がここに表示されます

プレーンテキストの文字起こし、またはインラインの音声プレーヤーが得られます(ツールにより異なります)。

使い方 音声文字起こし

  1. uploadをクリックして音声ファイルを選択します(MP3、WAV、M4A、WebM、OGG、FLAC、またはMP4、最大25MB)。
  2. 文字起こしを開始し、Whisper が音声を処理する数秒間お待ちください。
  3. 返ってきた文字起こしを画面上で確認します。
  4. テキストをコピーするかダウンロードして、メモ、キャプション、ドキュメントに使用します。

使用例

1

録音したインタビューを、記事に引用できるテキストに書き起こします。

2

講義やウェビナーの録音を、学習ノートに変換します。

3

スマートフォンで吹き込んだボイスメモの文字起こしを取得します

4

生の音声を文字起こしして、ポッドキャストのエピソードに字幕を付ける

5

顧客との通話の検索可能なテキスト記録を作成します

最高の結果を得るためのヒント

  • 最もクリーンな文字起こしを得るために、静かな場所で録音し、マイクを話者の近くに置きましょう。
  • 録音が 25 MB を超える場合は、より短いセグメントに分割し、それぞれを文字起こししましょう。
  • ロスレス形式をMP3に変換すると、精度をほとんど損なわずに、サイズ制限内でより多くの分数を収められます。
  • 名前、専門用語、数字を校正しましょう。これらは小さな修正が必要になる可能性が最も高い語句です。

よくある質問

Audio Transcriber は何をするツールですか?

話し声の音声ファイルを文字テキストに変換します。録音をアップロードすると、元の言語を保持した文字起こしが返され、それをコピーまたはダウンロードできます。

どの音声フォーマットとファイルサイズをアップロードできますか?

MP3、WAV、M4A、WebM、OGG、FLAC、MP4のファイルを最大25 MBまで受け付けます。録音が長い場合は、各パートが上限を超えないようにファイルをトリミングまたは分割してください。

最初に言語を選ぶ必要がありますか?

いいえ。Whisperは数十の言語にわたって話されている言語を自動検出するため、何も設定せずにアップロードできます。文字起こしは、話された言語と同じ言語で返されます。

文字起こしはどれくらい正確ですか?

背景ノイズが少ないクリアな音声であれば精度は高くなります。強いアクセント、複数人の同時発話、音楽、録音品質の悪さはエラーの原因となるため、重要な文書では軽く校正することをおすすめします。

文字起こしを商用利用できますか?

はい。書き起こしの出力はお客様に帰属し、記事、キャプション、メモ、クライアント業務に利用できます。無料プランは登録不要で1日5件の書き起こしが可能、Proは大量処理向けに月額$19です。

アップロードした音声はどうなりますか?

ファイルは書き起こしを生成するためにのみ処理された後、破棄されます。録音を保持することも、モデルの学習に使用することもありません。

タイムスタンプや話者ラベルを追加してくれますか?

出力は、話された言葉に焦点を当てた連続したテキストの文字起こしです。話者ごとにテキストを分割することはしません。きれいな結果を得るには、可能な限り1人の明確な主要話者の音声をアップロードしてください。

🔒
あなたのプライバシーは保護されています

テキストは保存されません。処理はリアルタイムで行われ、結果を生成した後すぐに入力が破棄されます。

無制限のアクセスを解除

無料ユーザー:1日10回の使用 | Proユーザー:無制限

関連ツール

音声インテリジェンス音声翻訳50以上の言語の音声をアップロードすると(MP3、WAV、M4A、WebM、OGG、FLAC、MP4は最大25 MB)、英語のテキストが返されます — ソース言語は自動検出、出力は自動翻訳。外国語の会議、国際的な情報源へのインタビュー、または話せない言語の動画コンテンツを見る際に最適です。Powered by OpenAI Whisper translate mode.音声インテリジェンス会議サマリー会議の音声をアップロードして(MP3/M4A/WAV/WebM/OGG/FLAC/MP4、最大25MB)、構造化されたサマリーを取得:3文の要約、重要な決定事項、アクション項目(担当者/内容/期日)、未解決の質問、貼り付け可能な50語のSlackアップデート。2段階パイプライン:OpenAI Whisperで文字起こし、次にGPTが構造を抽出。スタンドアップ、1on1、顧客電話、全社会議に最適。音声インテリジェンス音声ジャーナル音声メモ(MP3/M4A/WAV/WebM、最大25MB)を録音またはアップロードすると、整った形式のジャーナルエントリが作成されます。2段階処理:OpenAI Whisperが文字起こしを行い、その後GPTが「カンマ」「改行」などの指示に従って整形、複数のトピックごとに段落と見出しを分け、明らかな誤認識を修正します。要約や言い換えはせず、あなたの声と詳細をそのまま保存します。

このエージェントを試す

Agente Borrador de CumplimientoPolítica de privacidad + Términos de servicio + Política de cookies + Aviso GDPR adaptado a…このエージェントを試す →

関連ワークフロー

Podcast → Hilo de TweetsSube un archivo de audio de podcast → transcribe → genera un hilo de 7 tweets…ワークフローを実行 →

もっと読む