読み込み中...
読み込み中...
人の聴覚には届かない領域へ、流出追跡と学習撹乱の信号を埋め込みます。
公開後の無断利用を技術的に困難にし、流出が起きた場合には経路を辿れる状態を作るための、音声保護処理です。
— 声の権利を、技術で支える。
心理音響マスキングを応用し、聴感への影響を抑えながら処理を施します。 一般的な聴取条件下では元音声との差異を知覚しにくい水準を目標とし、 AI 音声合成モデルの学習を撹乱する設計です。
処理時に固有の識別情報を埋め込みます。万一流出が発生した場合、 「いつ・誰向けに加工された音声か」を識別子から照会できる仕組みです。
最上位レベルでは、AI が学習した結果の音声側にも痕跡が残るよう設計しています。 無断学習の事後検証を視野に入れた構成です (詳細は特許出願準備中のため非公開)。
受け渡し相手ごとに記録できます。相手別に処理することで、 流出経路の絞り込み精度が向上します。任意項目のため、空欄でも処理は実行されます。
RVC や so-vits-svc、ElevenLabs といった音声合成モデルは、 数分程度の音声データから声を再現できる水準に達しています。 そのため、音声を公開すること自体が無断学習のリスクを伴う状況になっています。
本機能では、心理音響マスキング理論を応用し、人の聴覚への影響を抑えながら処理を施します。 一般的な聴取条件下では元音声との差異を知覚しにくい水準を目標としつつ、 AI モデルの学習を撹乱する信号と、流出時の追跡用識別子を埋め込む仕組みです。 ただし、音源の特性や再生機器・聴取環境により、わずかなノイズが知覚される場合があります。
最上位の aggressive レベルでは、AI が学習した結果の音声からも 元の声を辿る可能性を視野に入れた追加処理を組み込んでいます。 具体的な仕組みは特許出願準備中のため非公開です (実証実験は継続中)。
※ AI モデルは継続的に進化しており、防御効果を保証するものではありません。 本機能は無断学習の試みに対する追跡可能性を高めることを目的としています。