1.

論文(リポジトリ)

論文(リポジトリ)
高良, 富夫 ; 大石, 節 ; Takara, Tomio ; Ooishi, Takashi
出版情報: 2008-05.  高良富夫
URL: http://hdl.handle.net/20.500.12000/13549
概要: 科研費番号: 17500116
平成17年度~平成19年度科学研究費補助金(基盤研究(C))研究成果報告書
研究概要:(平成18年度時点)高速コンピュータ及び高速通信網の発達により、音声や映像を用いた通信や処理、すなわち
マルチメディア通信処理が進展しつつある。音声を用いた高度のヒューマンインターフェースとしての音声合成技術や音声自動認識も実用化されつつある。しかし、これらの技術は、主として西欧語、日本語、中国語などの主要な言語に対するものであり、必ずしも主要でない言語に対応した音声合成・認識の研究は進展しているとはいえない。そこで本研究では,琉球方言の音声合成システムを発展させた汎用音声合成システムを、アジアのいくつかの言語に適用し、これらの言語にも応用可能な、より汎用的な音声合成シェルを構成する。今年度は、以下のことを行った。 (1)ヴェトナム語の連続音声合成システムの構成平成17年度のプロトタイプを基にして、ヴェトナム語の連続音声合成システムを完成させた。特に、Broken Toneについてパワーの生成モデルを提案した。ヴェトナム出身の学生が本研究室に再留学したので、この研究を大いに推進した。 (2)バングラデシュ語の音声合成システムのプロトタイプの作製音声合成シェルを利用してバングラデシュ語の音声合成システムのプロトタイプを作製した。ここでは、バングラデシュ語の母音のすべてにある対応する鼻母音の規則化が研究課題である。この研究の中で、同じ一つの母音がバングラデシュ人と日本人とでは別の音韻に聞こえることを見出し、国際会議で発表した。 (3)音声合成スペクトルエディタの評価・改良前年度に構成された音声合成スペクトルエディタを評価し、これを改善した。また、これを用いて音声に含まれる個人性の要因分析を行った。まず、音声を、個人性の特徴と考えられるスペクトル、基本周波数、パワー、及びスペクトルのタイミングに分解し、いくつかの組み合わせで合成して、これがどの話者の声に聞こえるかを聴取実験により確認した。また、エチオピア語のストレスの物理的要因がパワーでなく、ストレス母音の直後の子音が長くなることによることを合成音声の聴取実験により示した。
未公開:P.1以降(別刷論文のため)
研究報告書
続きを見る
2.

論文(リポジトリ)

論文(リポジトリ)
高良, 富夫 ; 大石, 節 ; Takara, Tomio ; Ooishi, Takashi
出版情報: 2003-04.  高良富夫
URL: http://hdl.handle.net/20.500.12000/13548
概要: 科研費番号: 12680419
平成12年度~平成14年度科学研究費補助金(基盤研究(C)(2))研究成果報告書
研究概要:琉球方言は、言語学上、日本語の中で特異な位置を占める。これを研究することにより、他の方言にはない
特別の視点から日本語を眺めることができるので、日本語の研究に大きく寄与することができる。そこで我々は、ディジタル音声処理の手法により、音声を人工的に合成し、琉球方言の音声を高精度に分析した。さらに、琉球方言の中の多様な各方言を合成することができる汎用音声合成ンステムを開発し、多様な方言の高精度分析を可能にした。しかし、この汎用音声合成システムは、時間的な広がりに関しては限界があった。すなわち、このままでは古典琉球語の音声は合成できない。沖縄には「おもろそうし」のように古典琉球語でつづられた詩歌があり、しかもその一部は歌唱が伝承されている。琉球方言を含む日本語の研究を、空間的だけでなく時間的にもさらに広げるためには、これら古典琉球語の研究が不可欠である。そこで本研究では、古典琉球語で書かれたテキストから音声を合成するシステムを開発した。このシステムにより、古典琉球語をモデル構成論的に研究することができる。「おもろそうし」の伝承された謡曲の楽譜を分析し、その特徴をマルコフモデルで表し、「おもろそうし」のテキストから歌唱音声を自動的に生成するするシステムを構成した。実験の結果、伝承された謡曲は、このシステムにより70%の精度で正しく再現することができた。よって、古典琉球語の音声に関する法則性が、この精度で明らかになったといえる。伝承されていない謡曲も、この精度で歌唱できるといえる。
要約(欧文):Ryukyuan dialect occupies linguistically a special position in the Japanese language. Because we can observe the Japanese language from the special viewpoint, which is not involved in the other dialects, by studying the Ryukyuan dialect, we can contribute very much to the study on the Japanese language. Therefore, we have analyzed Ryukyuan speech accurately by synthesizing speech artificially using the technique of digital signal processing. And we have made it possible to analyze diverse dialects precisely by developing the general speech synthesis system which can synthesize each dialect of diverse Ryukyuan dialects. However, this general speech synthesis system has a limitation in time range. The system as it is cannot synthesize speech of classical Ryukyuan language. There are poems written in the classical Ryukyuan language such as "Omoro Soshi", and some of them are handing down. In order to expand not only in space but also in time the study of the Japanese language including Ryukyuan dialect, we need to study the classical Ryukyuan language. Therefore in this study, we developed the system in which speech is synthesized from a text written in the classical Ryukyuan language. By using this system, we can study the classical Ryukyuan dialect by the model constructive method. We analyzed the musical score of some handed-down poems of "Omoro Soshi" and expressed them by the Markov model, then, constructed a system which generates automatically singing voice from the test of "Omoro Soshi". As a result of experiment, the songs are replayed correctly by this system with 70% accuracy. Therefore, we can say that law of the classical Ryukyuan language is clarified with this accuracy. We may expect that non-handing-down songs can also be sung with this accuracy.
未公開:P.5以降(別刷論文のため)
研究報告書
続きを見る