バイノーラルビートを聞く

バイノーラルビートとは 人間の脳は、それぞれの耳にわずかに異なる周波数を流し込むことで「聴こえないはずの音」(ビート)を自分で作り出します。これがバイノーラルビート(binaural beat)と呼ばれる現象です。 バイノーラルビートは「脳が周波数の差分を知覚する」現象で、FFR(Frequency Following Response)と呼ばれる脳の機能によって発生します。 左右の耳に例えば440Hzと445Hzの音を流すと、その差(5Hz)のリズムが脳内で生じ、このビートを感じます。 この効果を活かした音は、集中、リラクゼーション、睡眠などの補助に古くから利用されています。 聞いてみる 周波数によって異なる効果が得られます 1–4 Hz:Δ(デルタ)波 → 睡眠・深い休息 4–8 Hz:Θ(シータ)波 → 瞑想・夢見状態 8–12 Hz:α(アルファ)波 → リラックス・創造的思考 12–30 Hz:β(ベータ)波 → 集中・覚醒状態 ※ステレオヘッドホンが必須です 両耳に独立した信号を届けるため、ヘッドホンでの視聴が必要です。 バイノーラルビートで遊べるアプリを作りました。 以下のツールで、バイノーラルビートをすぐに試せます!ぜひ試してみてね! バイノーラルビートメーカー Pythonで試してみる Pythonでも簡単に音声ファイルを生成できます。以下のコードで、左耳440Hz・右耳445Hzのステレオ音声(10秒)を作成できます: # pip install numpy soundfile import numpy as np import soundfile as sf rate, dur = 44100, 10 t = np.linspace(0, dur, rate * dur, endpoint=False) left = 0.5 * np.sin(2 * np.pi * 440 * t) right = 0.5 * np.sin(2 * np.pi * 445 * t) stereo = np.stack((left, right), axis=-1) sf.write("binaural_10s.wav", stereo, rate) ☕ さいごに この記事を作りながらバイノーラルビートを聞いていたら耳が疲れました。 ...

6月 7, 2025

最新の音声AIを試す

1. はじめに AIの進化は、かつてないスピードで私たちの生活やビジネスに浸透しています。 OpenAIのChatGPTやGoogleのGeminiなど、競争がすごいです。 テキストから音声を生成する「音声合成」の分野も、生成AIの革新と同時に目覚ましい発展を遂げています。 本記事では最近出てきたGoogleの Gemini 2.5 TTS、OpenAI TTSや、結構前から人気のあるVoiceVoxのずんだもんなどを改めてまとめました。 名称 公開年月日 主な特徴 ずんだもん 2021年6月(VOICEVOX) ・無料・商用利用可(VOICEVOX) ・東北ずん子の弟設定 ・立ち絵やMMD素材も豊富 OpenAI TTS 2023年11月6日(OpenAI Dev Day) ・リアルな合成音声(6種類) ・文字→音声変換と音声合成を統合 ・音声の個性・感情表現も可能 Gemini 2.5 Pro 2025年3月25日(実験版) 2025年5月6日(プレビュー版) ・Googleの最先端AIモデル ・高度な推論・コーディング能力 ・マルチモーダル対応(テキスト、音声、画像、動画) 2. 出力してみた 百聞は一見に如かず、ならぬ百見は一聞に如かず、です。出力してみたので聞いてみてください。 説明 女声 男声 ずんだもん - OpenAI TTS Gemini 2.5 Pro この中だと、自然な音声という観点ではGeminiが頭一つ抜けてる感じがあります。 ずんだもんは、人の声として不自然ですが馴染みもあり、聞き取りやすいという点では現在でも優れている合成エンジンだと思います。 それぞれのUIメモ。UIは全部同じクオリティだと思います。VOICEVOXはイントネーションを指定することができます。 — ずんだもんUI — OpenAI TTS UI — Gemini Pro 2.5 UI ...

5月 28, 2025

Voice Range Onlineを公開しました

Voice Range Online は、ブラウザ上で自分の音域を簡単に測定・可視化できる無料のウェブアプリです — アプリのインストールやアカウント登録は一切不要! 🎙️ 音声録音 & ピッチ検出 クリック一つで音声を録音し、音の高さ(F0, 基本周波数)を検出します。 低い声ほどF0が低く、高い声ほどF0が高くなります。 男声と女声で、それぞれ平均的な範囲は決まっていますが、それを超えて音域が広い人も存在します。 このアプリで使用してるpYIN(probabilistic YIN) は、人の声の高さを滑らかに、そして高精度に推定するアルゴリズムです。 もともとは「YIN法」という方法を改良したもので、確率モデルを使って、より信頼できる結果を出します。 📊 音域の可視化 発声された音の最低音と最高音を記録し、あなたの「音域」をグラフィカルに表示します。 トレーニングの進捗や、自分の歌唱範囲の確認に最適です。 🔄 繰り返しトレーニング対応 何度でも録音して、自分の音域がどう変化しているかを確認できます。 ピッチ履歴は画面上に残るため、複数回の測定比較も可能です。 💻 技術スタックメモ React ユーザーインターフェースの構築に使用。 Material-UI (MUI) 見た目が美しく、操作性の高いレスポンシブUI。困ったらこれ。 Web Audio API マイクからの音声を取得する。 Librosa 音声解析にはPythonのライブラリのLibrosaを使っています。便利。 Flask 解析プログラムの実装には、Python+Flaskを使用しています。 プログラムはRender.comにデプロイしています。 無料プランなので、長い音声データを送ると落ちちゃうのそのうち何とかしたいね。

5月 9, 2025

Voice Studio Onlineを公開しました

Voice Studio Online は、ブラウザ内で簡単に音声を録音して10種類の多彩なエフェクトを適用できる音声スタジオです — ダウンロードやサインアップは不要です! 🎙️ 主な機能 📹 音声録音 クリック一つで高品質な音声を録音できます。マイクからの音声はリアルタイムでデジタル化され、ブラウザ内で処理されます。 🎭 10種類のエフェクト 1. 逆再生 (Reverse) 音声を時間軸で完全に反転させます。 " こ ん に ち は " → " は ち に ん こ " 2. 高速再生 (2倍速) 音声を2倍の速度で再生します。チップマンクのような高い声になります。 3. 低速再生 (0.5倍速) 音声をゆっくりと再生します。重厚感のある低い声になります。 4. ロボットボイス ビットクラッシングとリングモジュレーションで機械的な声に変換します。 5. エイリアンボイス 複数の低周波数振動子(LFO)を使用して宇宙人風の不思議な声を作ります。 6. チップマンクボイス タイムストレッチ技術で自然な高音ボイスを生成します。 7. デーモンボイス ピッチシフトで悪魔のような低音ボイスを作成します。 8. エコーエフェクト 300msの遅延でエコー効果を追加し、洞窟のような響きを演出します。 9. ハウリングエフェクト フィードバックループを使用してハウリングサウンドを生成します。 10. カスタムエフェクト 複数のエフェクトを組み合わせたユニークなサウンドを作成できます。 ...

4月 18, 2025

Voice Reverser Onlineを公開しました

Voice Reverser Online は、ブラウザ内で簡単に音声を録音して様々なエフェクトを適用できる楽しいウェブアプリです — ダウンロードやサインアップは不要です! こんな感じになりました! 🎤 音声録音 クリック一つで音声を録音できます。 音声は空気中を伝わる振動です。 人が発声したりすることで生み出される音声は、スマートフォンやパソコンについているマイクによってデジタルデータとして取り込むことができます。 例えば、“はじめまして"と発声した音声は、以下のグラフのような振動として見ることができます。 🔁 逆再生 録音した音声を瞬時に逆再生することができます。 録音した音声のデジタルデータを時間軸方向に反転することで逆再生されます。 🔼🔽 ピッチ調整 ピッチを調整して、チップマンクやロボットのような音声に変更できます。 Voice Reverser Onlineという名前だけど、簡単に追加できたので追加してます。 録音した音声のデジタルデータを時間軸方向に圧縮したり、引き延ばす事で音声の周波数が変更されます。圧縮するとピッチが高くなり、引き延ばすとピッチが低くなります。 🔐 プライバシー 音声データはすべてブラウザ内で処理され、アップロードされたり保存されたりすることはありません。 💻 技術スタックメモ React ユーザーインターフェースを構築するために使用しています。 Material-UI (MUI) モダンでレスポンシブなデザインを提供するUIライブラリです。見た目が可愛くなってよい。 Web Audio API 音声データの取得、処理、再生を行うために使用しています。 音声の逆再生やピッチ変更などの処理をブラウザ内で直接行うことができる。

4月 16, 2025