読み込み中...
読み込み中...
Voice Protection
公開する音声に、聞こえない範囲で保護処理を施します。AI による無断学習への対策と、流出時の出所追跡を兼ねた仕組みです。
相手別に処理しておくと、流出時の経路特定が容易になります。空欄でも処理可能です。
RVC や so-vits-svc、ElevenLabs といった音声合成モデルは、 数分程度の音声データから声を再現できる水準に達しています。 そのため、音声を公開すること自体が無断学習のリスクを伴う状況になっています。
本機能では、心理音響マスキング理論を応用し、人の聴覚への影響を抑えながら処理を施します。 一般的な聴取条件下では元音声との差異を知覚しにくい水準を目標としつつ、 AI モデルの学習を撹乱する信号と、流出時の追跡用識別子を埋め込む仕組みです。 ただし、音源の特性や再生機器・聴取環境により、わずかなノイズが知覚される場合があります。
最上位の aggressive レベルでは、AI が学習した結果の音声からも 元の声を辿る可能性を視野に入れた追加処理を組み込んでいます。 具体的な仕組みは特許出願準備中のため非公開です (実証実験は継続中)。
※ AI モデルは継続的に進化しており、防御効果を保証するものではありません。 本機能は無断学習の試みに対する追跡可能性を高めることを目的としています。
心理音響マスキングを応用し、聴感への影響を抑えた処理を施します。AI 音声合成モデルの学習を妨げる設計です。
処理時に固有の識別情報を埋め込みます。流出時はその識別子から「いつ・誰向けに加工された音声か」を照会できます。
最上位レベルでは、AI が学習した出力音声にも痕跡が残る設計です。無断学習の事後検証に対応します (詳細は特許出願準備中)。