Speechly API
Shares tags: audio
迅速かつ簡単に、OpenAIの最先端の音声認識技術「Whisper」とNvidiaの「Parakeet」を利用して、音声ファイルをテキストに書き起こすことができます。会議、講義、またはその他の重要な音声を記録する際、MacWhisperは音声ファイルを素早く正確にテキストに変換します。📲 MacWhisperはiPhoneおよびiPadでも利用可能です。こちらからダウンロードできます。 ### 機能の全リスト - Macで音声ファイルを簡単に録音・書き起こし。 - 全てのトランスクリプトに対するフルテキスト及びスピーカー検索。 - Whisperによるシステム全体でのディクテーション機能。Apple独自のディクテーションを置き換え、最高のWhisperモデルでも利用可能。 - 音声ファイルをドラッグ&ドロップするだけで高品質なトランスクリプションを取得。 - Zoom、Teams、Webex、Skype、Chime、Discordなどで会議を自動録音。 - マイクやMacの他の入力デバイスから直接録音。 - 全てのトランスクリプションはデバイス上で行われ、データは外部に出ません。これにより、インタビューなどの機密性の高い音声にも最適なアプリです。 - トランスクリプトを.whisperファイルとして保存またはエクスポート可能で、元の音声と全ての編集を含み、簡単に共有できます。 - .srtおよび.vtt字幕のエクスポート、さらにcsv、dot、docx、pdf、markdown、html形式のエクスポートにも対応。 - メタルおよびGPUサポートによる非常に高速なトランスクリプション。 - 数秒で正確なテキストトランスクリプション(最大約30倍のリアルタイム)。 - 全文検索と単語のハイライト機能。 - トランスクリプトに同期した音声再生。 - 100言語以上に対応。 - トランスクリプト全体または個別のセクションをコピー。 - セグメントをお気に入りに登録。 - コンパクトモード(タイムスタンプを非表示)。 - “あ”や“え”などのフィラー語を自動的に削除。 - Voice Memosから直接ドラッグ&ドロップ。 - トランスクリプトからセグメントを編集・削除。 - 最大2スピーカーを手動で追加。 - インラインビデオプレイヤー。 - 字幕に同期したビデオ再生。 - 複数の言語の字幕を同時に表示。 - トランスクリプション言語を選択(または自動検出)。 - 再生速度を0.5から3.0倍まで変更。 - 対応フォーマット:mp3、wav、m4a、ogg、opus、mov、mp4ビデオ。 - Whisperの設定調整(ビームサーチ/グリーディ、ビームサイズなど)。 - 全てのWhisperモデルをサポート、一部モデルはProユーザー専用。 ### MacWhisper Pro - 上記の全機能 - Parakeet v2サポート(最高精度で最大300倍のリアルタイムトランスクリプション対応)(MシリーズMacのみ)。 - ローカルモデルによる自動スピーカー認識(MシリーズMacのみ)およびElevenLabsおよびDeepgramとの連携。 - ディクテーションモードでの自動スペル、句読点、文法改善(AIサービスの設定が必要)。 - 一度に多くのファイルをバッチトランスクリプション。 - WhisperKitおよびDistilledモデルをサポート。 - Make.com、n8n、Zapierの統合、またはカスタムWebフックを使用して自動的にトランスクリプトを転送。 - YouTubeビデオのトランスクリプトを作成。 - フォルダーサポートで、特定のディレクトリに追加されたファイルを自動的にトランスクリプト化。 ...(以下同様に続く) さらに、プライバシーポリシーと利用規約、100以上のサポート言語、システム要件、レビューなども記載されています。詳細は公式サイトをご参照ください。
Tags
Similar Tools
Other tools you might consider
overview
迅速かつ簡単に、OpenAIの最先端転写技術WhisperやNvidia Parakeetを使用して音声ファイルをテキストに変換できます。会議、講義、その他の重要な音声を録音している場合でも、MacWhisperは音声ファイルを迅速かつ正確にテキストに転写します。📲 MacWhisperは現在、iPhoneとiPadでも利用可能です。こちらからダウンロードしてください。 **機能一覧** - Mac上で音声ファイルを簡単に録音・転写 - すべての転写内容からフルテキストおよび発話者検索 - Appleの音声入力に代わるシステム全体の音声入力機能をWhisperで実現し、最高のWhisperモデルにも対応 - 音声ファイルをドラッグ&ドロップするだけで高品質な転写を取得 - Zoom、Teams、Webex、Skype、Chime、Discordなどで会議を自動録音 - Macのマイクまたは他の入力デバイスから直接録音 - 転写はすべてデバイス内で行われ、データは機械を離れません。これにより、インタビューなどの機密音声データに最適なアプリとなります。 - 転写内容を.whisperファイルとして保存またはエクスポートし、元の音声とすべての転写編集が含まれるため、簡単に共有できます。 - .srtおよび.vttの字幕エクスポートに加え、csv、dote、docx、pdf、markdown、htmlへのエクスポートも対応 - メタルおよびGPUサポートによる非常に高速な転写 - 数秒で正確なテキスト転写を取得(リアルタイムの最大約30倍) - 転写全体を検索し、単語をハイライト - 転写に同期した音声再生 - 100種類の言語をサポート - 転写全体または個々のセクションをコピー - セグメントのスター付け/お気に入り - コンパクトモード(タイムスタンプを非表示) - 音声フィラー(あいづち等)を自動で除去 - ボイスメモから直接ドラッグ&ドロップ - 転写からセグメントを編集・削除 - 最大2人の発話者を手動で追加 - インラインビデオプレーヤー - 字幕に同期したビデオ再生 - 複数の言語字幕を同時にビデオプレーヤーで表示 - 転写言語を選択(または自動検出) - 再生速度を0.5から3.0倍に変更(音声およびビデオ) - 対応フォーマット:mp3、wav、m4a、ogg、opus、mov、mp4 - Whisper設定の調整(ビームサーチ/グリーディ、ビームサイズ等) - すべてのWhisperモデルをサポート、一部のモデルはProユーザーのみ完全に利用可能 **MacWhisper Pro** - 上記のすべての機能 - MシリーズMacでのParakeet v2サポート(最高の精度で300倍のリアルタイム転写に対応) - MシリーズMacのみのローカルモデルによる自動スピーカー認識 - ElevenLabsおよびDeepgramによる自動のスペル、句読点、文法改善(AIサービスがセットアップされている必要あり) - 一度に多くのファイルをバッチ転写可能。番組のすべてのシーズンに字幕を追加したり、多くのインタビューを処理したりする場合に便利 - WhisperKitおよびDistilledモデルに対応 - Make.com、n8n、Zapier、カスタムWebフックとの統合で転写を自動転送 - YouTubeビデオを転写 - 特定のフォルダーにファイルが追加されたときに自動で転写するウォッチフォルダーサポート。ファイルはさまざまなフォーマットで自動的に転写できます。 - OpenAI(ChatGPT)、Anthropic(Claude)、Groq、Ollama、XAi、Deepseek、カスタムOpenAI APIエンドポイント、Azure AIモデルのサポートによる簡単なプロンプト - OpenAI、ElevenLabs、Deepgram、Groq、カスタムWhisperサーバーを通じたクラウド転写 - 転写にスピーカーを手動で追加して、きれいなエクスポートを実現 - MacのどこからでもアクセスできるメニューバーアプリでWhisperにアクセス - SpotlightのようなビューでどこからでもMacWhisperにアクセスし、瞬時に転写し、他のアプリに簡単に貼り付け - ChatGPTとの統合(自身のAPIキーで) - [SILENCE]などのセグメントが転写に表示されないように無視 - GPT4、GPT4 Turbo、GPT4o、GPT4o-miniおよび古いモデルをサポート - Anthropic Claudeとの統合(自身のAPIキーで) - システムオーディオの録音・転写(会議録音など) - Tiny(英語のみ)、Tiny、Base、Small、Medium、Large(V2およびV3)モデルをサポート - 自分のカスタムGGMLモデルを追加 - Whisperを通じて音声ファイルを別の言語に翻訳(MediumまたはLargeモデルを使用、結果は完璧ではなく、より高度な方法を模索中) - 自分の(無料の)DeepL APIキーを追加することで全文転写を翻訳 - 字幕を異なる言語に翻訳 - 専用のビデオプレーヤーと字幕および複数の翻訳字幕のサポート - 各ホストの単一トラック音声を組み合わせてポッドキャストを転写(ベータ版) - 一回払い、サブスクリプションなし。一度払いで永久使用。優先サポート。問題があれば、できるだけ早くメールでお返事します。 - ジャーナリスト、学生、非営利団体の方は、support@macwhisper.comにメールを送信し、作業内容を教えていただければ30%オフになります🙂 - MacWhisper Proを購入し、満足できない場合は、7日以内に改善点をお知らせいただければ返金します。 - OpenRouter、ElevenLabs ScribeおよびDeepgram Novaのサポート MacWhisperをダウンロードした後、すべてのPro機能をアンロックするためにライセンスキーを入力する必要があります。20ライセンス以上を購入する場合やMDMデプロイメントなどのカスタムが必要な場合は、support@macwhisper.comにメールを送るか、MDM文書をチェックしてください。 **100以上の対応言語** MacWhisperは以下の言語で音声を転写できます:英語、中国語、ドイツ語、スペイン語、ロシア語、韓国語、フランス語、日本語、ポルトガル語、トルコ語、ポーランド語、カタルーニャ語、オランダ語、アラビア語、スウェーデン語、イタリア語、インドネシア語、ヒンディー語、フィンランド語、ベトナム語、ヘブライ語、ウクライナ語、ギリシャ語、マレー語、チェコ語、ルーマニア語、デンマーク語、ハンガリー語、タミル語、ノルウェー語、タイ語、ウルドゥー語、クロアチア語、ブルガリア語、リトアニア語、ラテン語、マオリ語、マラヤーラム語、ウェールズ語、スロバキア語、テルグ語、ペルシャ語、ラトビア語、ベンガル語、セルビア語、アゼルバイジャン語、スロベニア語、カンナダ語、エストニア語、マケドニア語、ブルトン語、バスク語、アイスランド語、アルメニア語、ネパール語、モンゴル語、ボスニア語、カザフ語、アルバニア語、スワヒリ語、ガリシア語、マラーティー語、パンジャビ語、シンハラ語、クメール語、ショナ語、ヨルバ語、ソマリ語、アフリカーンス語、オシタン語、グルジア語、ベラルーシ語、タジク語、シンド語、グジャラート語、アムハラ語、イディッシュ語、ラオ語、ウズベク語、ファロー語、ハイチ・クレオール語、パシュトー語、トルクメン語、ニーノルスク、マルタ語、サンスクリット語、ルクセンブルク語、ミャンマー語、チベット語、タガログ語、マダガスカル語、アッサム語、タタール語、ハワイ語、リンガラ語、ハウサ語、バシキール語、ジャワ語、スンダ語。 **システム要件** MacWhisperは、正常に機能するために多くのコンピュータメモリを必要とします。MediumおよびLargeモデルを使用するには、Macに8GB以上のRAMが必要です。古いIntelベースのMacではパフォーマンスが悪いことがありますが、適切にテストできていません。 **プライバシーポリシーと利用規約** **レビュー** 👨💻 私のその他のmacOSユーティリティもご覧ください: - OpenAIバンドル - すべてのOpenAIアプリを割引価格で入手 - MacGPT - Mac上でChatGPTを使用し、メニューバーからアクセス - Detective - macOS用のGPT Vision - Voices - OpenAIによる高品質なテキスト読み上げ - Text Assistant - 有用なテキストを生成し、GPTと自分のOpenAPIキーでプロンプトを管理 - Vivid - MacBook Proの輝度を倍増、常にHDRモードを使用 - Forehead - ノッチを隠し、MacBookの角を丸める - Cooldown - メニューバーから省電力モードを迅速に切り替え - Speedy - メニューバーでの高速Speedtest - Pippo - シークコントロール付きのピクチャー・イン・ピクチャー動画プレーヤーの改善 Whisperはゲオルギー・ゲルガノフのすべての努力を基にして作られました。彼のWhisper実装についてはこちらをチェックしてください: [https://github.com/ggerganov/whisper.cpp](https://github.com/ggerganov/whisper.cpp)