Challenge Grant: 喉頭全摘出後の患者における読唇技術を応用した代用音声の開発

横断

研究概要

tomisato

本研究では、読唇技術を用いて口元の動画を言語に変換し、AI合成音声によって音声に変換するデバイスの開発を目指しています。喉頭癌などの治療によって音声を喪失する患者はまだ多いです。従来の代用音声では、明瞭さや持続性に問題が残っています。今回開発を目指すデバイスによって、この問題点を解決するとともに、患者さんの元の声を再現することができます。音声を喪失した患者さんのQOL向上に寄与できる研究です。


2025年度事業計画

■2025年度の新規活動目標と内容、実施の背景

2025年度は、喉摘全摘出後の患者さんにおいて現在の読唇技術が適応できるのか検討を行います。喉摘全摘出後の患者では、代用音声を使用しているかどうかや使用している代用音声の種類によって、口の動かし方が異なる可能性があります。 慶應義塾大学病院に通院中の喉頭全摘出後の患者さんに研究協力を依頼し、読唇技術によって実際に口元を読み取れるのか検討します。1つ1つの文字のレベル、単語のレベル、文章のレベルと複雑さを変えて、それぞれ検討します。 その結果応じて喉摘全摘出後の患者さんに合わせた修正を行い、喉頭全摘出後の患者さんでも適応可能な読唇技術の確立を目指します。



SDGs

3. すべての人に健康と福祉を3. すべての人に健康と福祉を
10. 人や国の不平等をなくそう10. 人や国の不平等をなくそう
11. 住み続けられるまちづくりを11. 住み続けられるまちづくりを

プロジェクトメンバー

プロジェクトメンバー・所員について

◎印は研究代表者

氏名 所属研究機関 職位 研究分野・関心領域
◎ 富里 周太 医学部 助教 耳鼻咽喉科学、音声言語障害
満倉 靖恵 理工学部 教授 知能情報学、感性情報学、電子デバイス・電子機器
小澤 宏之 医学部 教授 耳鼻咽喉科学
甲能 武幸 医学部 専任講師 耳鼻咽喉科学、音声言語障害
矢田 康人 東京都立大学 専門研究員 言語学