2007年[ 技術開発研究助成 (奨励研究) ] 成果報告 : 年報第21号

音声障害診断を目的とした声帯の力学的特性評価システムの開発

研究責任者

野村 英之

所属:金沢大学大学院 自然科学研究科 電子情報科学専攻 助手

共同研究者

船田 哲男

所属:金沢大学大学院 自然科学研究科 信号処理講座 教授

概要

1. はじめに
人間にとって「音(音声)」は重要なコミュニケーション手段である。近年では人間-人間のみならず、コンピュータを代表とする機械とのインターフェースとしての役割を果たすことも期待されている。この声を出すという行為、すなわち「発声」は多くの人にとって当たり前の行為であるが、発声器官に障害が生じると、社会生活においてコミュニケーションが大きく阻害される。
普段何気なく我々は発声を行っているが、そのメカニズムには未だ不明な点も多い。発声は1)音源の生成、2)声道内伝搬による調音(フィルタリング)、3) 口唇からの放射のプロセスからなる。特に音源の生成は力学的、及び生理学的作用の相互作用による複雑な現象であり、外部から観察が困難なことも合わせ、十分な理解がなされていない。したがって、発声器官に障害が生じた場合の影響についてはより一層不明確である。
これら、音声障害に対する工学的観点からのアプローチは、音声を信号処理し、そこから得られる特徴を元に統計的に評価する方法(音声情報処理的手法)が多く研究されてきた1)。しかしながら、本来、音声(生成)は複雑な物理的プロセスを経るものであり、このような方法では個々の特徴を捉えるためには限界がある。より正確に障害を数値的に評価するためには、物理的な特性を考慮した評価方法の開発が必要である。
本研究は発声器官である声帯の力学的特性を評価するシステムを開発するための基礎検討を行う。本報告はその基礎検討として、声帯の力学的パラメータの変化が、生成される音声へ及ぼす影響について検討を行う。また、声帯の力学的特性の評価手法に関する提案、及びその妥当性についてシミュレーションをもとに検討を行う。
2. 喉頭の物理モデル
人間の音声生成プロセスを大別すると、音源の生成と、声道などによる調音(フィルタリング)からなる。さらに、音源の生成は主に母音生成に関与し、声帯の振動に起因する有声音源(声帯音源)と、子音生成に関与する、声道などの狭めでの乱流に起因する乱流音源に区別される。本研究は、発生障害として喉頭の疾患によるものを対象とする。すなわち、声帯音源がその対象となる。
まず、声帯音源のモデルの説明を行う。ここではIshizaka and Flanagan が提案した声帯の2質量モデル2)を元に数値実験を行う。これは左右の声帯をその力学的特性、及び動作が左右で対称とし、一方の声帯を上唇と下唇にわけ、機械素子で表現するものである。それぞれを質量、バネ、及びダンパで構築し、上唇、及び下唇をバネで結合するものである。一般に、左右声帯の力学的特性が対称であれば、その運動も対称になると考えられる。しかし、詳細な声帯の物理モデルによる数値シミュレーションを行ったところ、健常者で左右の力学的特性が対称な場合でも、得られる声帯振動は非対称であった3)。そこで本研究では、喉頭疾患のモデリングの適切化のため、左右の声帯を独立なもの、すなわち力学的特性、及び動作ともに非対称な形でモデル化する。 声帯モデルを図1に示す。図中、m1R, m2R, m1L, m2Lは分割した声帯の質量、k1R, k2R, k1L, k2L, kcR, kcLはそれぞれのバネ定数、r1R, r2R, r1L, r2L はダンパの抵抗を表す。なお、添え字の1及び2 はそれぞれ上唇、及び下唇を意味し、R 及びL は右側、及び左側の素子を意味する。肺と口唇との圧力差により流れ(声門流れ)が生じ、その流れにより声帯が振動する。流れと声帯振動の相互作用により音声が生成される。ここでは、声帯の振動は声門流れ主流方向に対して垂直方向(図中の左右方向)に限定する。実際の声帯振動は声門流れ主流方向にも振動するが4)、その影響は小さいとして無視する5)。
モデルの運動は運動方程式で記述される。質量m1R, m2R, m1L, m2L についてそれぞれの運動方程式が成立し、それぞれを連立方程式として計算する。同時に声門流れの計算を行う。声門流れは流体の支配方程式を元に、等価的な電気回路を構成し、その回路方程式を解く。その詳細は文献2)に譲る。
このようなモデルを元に、喉頭疾患のシミュレーション、及び各種力学的パラメータが変化した場合の数値実験を行う。
3. 声帯の各種力学パラメータが生成音に与える影響(疾患音声のシミュレーション)
3.1 実験方法・条件
本研究において用いた主な力学的パラメータ(標準値)を表1に示す。これらの値はIshizaka and Flanagan の論文2)を参考にした。記号は図1と対応する。
本研究では、声帯の力学的パラメータを変化させ、それらが生成される音声に与える影響について数値実験を行う。ここではR側のパラメータのみを変化させ、左右非対称なモデルとして解析を行う。具体的には、ピッチ(声帯振動の基本振動数)f0、声門開放率Qoについて評価を行う。なお、母音は声道の形状で決定され、またこの負荷が声帯音源の動作に影響を与える。ここでは日本語5母音/a/, /e/, /i/, /o/, /u/を対称に実験を行う.
3.2 実験結果
健常時と疾患時の発声のシミュレーション結果を図2に示す。いくつかあるパラメータのうち、ここでは右側声帯の下唇の質量m1R を変化させた結果を示す。(a)が健常時(m1R/m1R0=100%)、(b)が疾患時(m1R/m1R0=172%)である。下付添え字0 は標準時の値を示す。上段は声門流れUg、下段は口唇での音圧波形pmouthである。なお、声道形状は/a/のものを利用した。この結果から、健常時は声門流れ、音圧ともに規則的な変化を示すが、疾患時はそれが不規則であることがわかる。シミュレーションで得られた合成音を聴いたところ、疾患時はあきらかに嗄声であった。
図3に声帯の力学パラメータを変化させながら、声帯振動のピッチf0 (基本振動数)、及び声門開放率Q0(声帯振動の周期と声門が開いている時間の割合)を測定した結果をまとめる。図は声道の形状をパラメータとしてまとめている。実際にはm1R, m2R, k1R, k2R, kcR を変化させて実験を行ったが、ここでは影響が顕著であったm1R の結果をまとめる。
ピッチ、声門開放率ともにm1R/m1R0>170%で変化が不規則になることがわかる。これは図2でみた結果と一致している。すなわちm1R/m1R0=100%のときは音圧も、声門流れも規則的であるが、m1R/m1R0=172%のときは、音圧、声門流れの大きさ、及びその周期ともに不規則であったことの現れである。特に、声門流れを見ると、大きなパルス状の流れとは別に小さな流れがところどころに発生している。このことは声門で不完全閉鎖が生じることを意味する。
これらの結果から、声門流れ、もしくは口唇での圧力波形の観測を行えば、声帯の力学的特性を推定できることが示唆される。
4. 声帯の力学的特性推定方法の検討
先の数値実験を参考に、声帯の力学的特性を推定するための基礎検討を行った。実験は以下のように行った。
(1) 超音波トランスデューサで口唇から超音波パルスを入射(周波数20 kHz)
(2) 反射パルスをマイクロフォンで測定、同時に頸部にてEGG(Electroglottography、電気喉頭図形)、及び加速度ピックアップで声帯の振動を測定
(3) 得られた信号を解析
ここで超音波を利用したのは、超音波放射圧6)を利用するためである。 結果は口唇から入力する音響エネルギーが低すぎるため、声帯振動を励起することが困難であり、力学的特性を推定するにはいたらなかった。
声帯を振動するのに必要な入射超音波パルスについて検討を行ったところ、数10? 100 kPa程度の音圧が必要であった。これは約1気圧となり、現実的には不適切な励起方法だといえる。頸部からパルス振動で声帯振動の励起を試みたが、十分な振動をえることはできなかった。今後、この声帯振動の励起方法の検討が課題である。
5. まとめ
声帯の力学的特性を推定する方法の検討を行った。まず数値実験により、声帯の力学的特性の変化が生成音に与える影響について検討を行った。その結果、値が標準値から大きくずれるとピッチの不安定性や、不完全閉鎖が生じることがわかった。また、声帯の力学的特性を推定する方法として、口唇から超音波パルスを入射して声帯振動を励起する方法を試みた。しかしながら、入力音響エネルギーの不十分さのため、声帯振動を励起することはできなかった。今後、声帯振動を励起する方法を検討する必要がある。