日常にあふれる音を用いて楽しむための、無料のオンライン音声処理ツール を提供しています。
デバイスのマイクで入力した音声を、逆再生したり、高速/低速再生することができます。想像しない聞こえ方になるよ!
あなたの声の音域を測定し、どれだけ広い音域を持っているかを知ることができます。
自分の声を分析し、似ている声の人を探してみよう。どんな声に似ているかな?
About#
Sound Tools では、シンプルかつ高機能な音声編集ツール を、ブラウザ上で使える形で提供することを目指しています。
音声を逆再生したり、音をミックスしたり、新しいエフェクトを試したり——どれも簡単に操作できます。
今後も様々なアプリの開発を進めていきますので、ぜひご期待ください。
FAQ#
音声が記録・保存されることはありますか?#
一切ありません。音声はお使いのブラウザ内だけで処理され、サーバーには保存されません。
オフラインでも使えますか?#
最高のユーザー体験を提供するため、オフライン版の提供はしておりません。すべての機能はオンライン専用です。
CHANGELOG#
2025年4月#
– 初回リリース。
1. はじめに AIの進化は、かつてないスピードで私たちの生活やビジネスに浸透しています。
OpenAIのChatGPTやGoogleのGeminiなど、競争がすごいです。
テキストから音声を生成する「音声合成」の分野も、生成AIの革新と同時に目覚ましい発展を遂げています。
本記事では最近出てきたGoogleの Gemini 2.5 TTS、OpenAI TTSや、結構前から人気のあるVoiceVoxのずんだもんなどを改めてまとめました。
名称 公開年月日 主な特徴 ずんだもん 2021年6月(VOICEVOX) ・無料・商用利用可(VOICEVOX)
・東北ずん子の弟設定
・立ち絵やMMD素材も豊富 OpenAI TTS 2023年11月6日(OpenAI Dev Day) ・リアルな合成音声(6種類)
・文字→音声変換と音声合成を統合
・音声の個性・感情表現も可能 Gemini 2.5 Pro 2025年3月25日(実験版)
2025年5月6日(プレビュー版) ・Googleの最先端AIモデル
・高度な推論・コーディング能力
・マルチモーダル対応(テキスト、音声、画像、動画) 2. 出力してみた 百聞は一見に如かず、ならぬ百見は一聞に如かず、です。出力してみたので聞いてみてください。
説明 女声 男声 ずんだもん - OpenAI TTS Gemini 2.5 Pro この中だと、自然な音声という観点ではGeminiが頭一つ抜けてる感じがあります。
ずんだもんは、人の声として不自然ですが馴染みもあり、聞き取りやすいという点では現在でも優れている合成エンジンだと思います。
それぞれのUIメモ。UIは全部同じクオリティだと思います。VOICEVOXはイントネーションを指定することができます。
— ずんだもんUI — OpenAI TTS UI — Gemini Pro 2.5 UI ...
Voice Range Online は、ブラウザ上で自分の音域を簡単に測定・可視化できる無料のウェブアプリです — アプリのインストールやアカウント登録は一切不要!
🎙️ 音声録音 & ピッチ検出
クリック一つで音声を録音し、音の高さ(F0, 基本周波数)を検出します。
低い声ほどF0が低く、高い声ほどF0が高くなります。 男声と女声で、それぞれ平均的な範囲は決まっていますが、それを超えて音域が広い人も存在します。 このアプリで使用してるpYIN(probabilistic YIN) は、人の声の高さを滑らかに、そして高精度に推定するアルゴリズムです。 もともとは「YIN法」という方法を改良したもので、確率モデルを使って、より信頼できる結果を出します。
📊 音域の可視化
発声された音の最低音と最高音を記録し、あなたの「音域」をグラフィカルに表示します。
トレーニングの進捗や、自分の歌唱範囲の確認に最適です。
🔄 繰り返しトレーニング対応
何度でも録音して、自分の音域がどう変化しているかを確認できます。
ピッチ履歴は画面上に残るため、複数回の測定比較も可能です。
💻 技術スタックメモ React
ユーザーインターフェースの構築に使用。 Material-UI (MUI)
見た目が美しく、操作性の高いレスポンシブUI。困ったらこれ。 Web Audio API
マイクからの音声を取得する。 Librosa
音声解析にはPythonのライブラリのLibrosaを使っています。便利。 Flask
解析プログラムの実装には、Python+Flaskを使用しています。 プログラムはRender.comにデプロイしています。 無料プランなので、長い音声データを送ると落ちちゃうのそのうち何とかしたいね。
Voice Reverser Online は、ブラウザ内で簡単に音声を録音して様々なエフェクトを適用できる楽しいウェブアプリです — ダウンロードやサインアップは不要です! こんな感じになりました! 🎤 音声録音
クリック一つで音声を録音できます。 音声は空気中を伝わる振動です。 人が発声したりすることで生み出される音声は、スマートフォンやパソコンについているマイクによってデジタルデータとして取り込むことができます。 例えば、“はじめまして"と発声した音声は、以下のグラフのような振動として見ることができます。 🔁 逆再生
録音した音声を瞬時に逆再生することができます。 録音した音声のデジタルデータを時間軸方向に反転することで逆再生されます。 🔼🔽 ピッチ調整
ピッチを調整して、チップマンクやロボットのような音声に変更できます。 Voice Reverser Onlineという名前だけど、簡単に追加できたので追加してます。 録音した音声のデジタルデータを時間軸方向に圧縮したり、引き延ばす事で音声の周波数が変更されます。圧縮するとピッチが高くなり、引き延ばすとピッチが低くなります。 🔐 プライバシー 音声データはすべてブラウザ内で処理され、アップロードされたり保存されたりすることはありません。
💻 技術スタックメモ React
ユーザーインターフェースを構築するために使用しています。 Material-UI (MUI)
モダンでレスポンシブなデザインを提供するUIライブラリです。見た目が可愛くなってよい。 Web Audio API
音声データの取得、処理、再生を行うために使用しています。 音声の逆再生やピッチ変更などの処理をブラウザ内で直接行うことができる。