1.

論文(リポジトリ)

論文(リポジトリ)
澤崎, 夏希 ; 遠藤, 聡志 ; 當間, 愛晃 ; 山田, 孝治 ; 赤嶺, 有平
出版情報: 知能と情報.  32  pp.668-677,  2020-04-15.  日本知能情報ファジィ学会
URL: http://hdl.handle.net/20.500.12000/47250
概要: 深層学習によって様々な分類問題が解決されているが,分類カテゴリ毎のデータ量が不均衡な問題を扱う場合,多くの課題がある.不均衡データへの対策として,少量カテゴリのデータ量を増加させ均衡化する手法がある.これをかさ増しと呼び画像処理分野ではノイ ズの付与や回転による方法が一般的である.最近ではGenerative Adversarial Network: GANによる画像生成手法を用いる場合がある.一方で,自然言語処理の分野では有効なかさ増し手法はいまだ確立されておらず,人手によるかさ増しが行われている.人手によるかさ増しではルールの設計など負担が大きく,機械的なかさ増し手法が必要となる.しかし,文章生成における機械的なかさ増しは画像生成に比べ不安定である.これは文章の特徴獲得の難しさが原因だと考えられる.そこで本論文ではグラフ情報に注目した機械学習による文章生成手法を提案する.CaboChaによって生成されたグラフ情報をGraph Convolutionにより畳み込み処理する.提案するGANにより生成されたかさ増し文章を3つの計算実験により評価し有効性を示した.
論文
続きを見る
2.

図書

図書
澤崎夏希[著]
出版情報: 西原町(沖縄県) : 琉球大学大学院理工学研究科, 2019.3
シリーズ名: 琉球大学大学院理工学研究科修士論文 ; 平成30年度
所蔵情報: loading…
3.

論文(リポジトリ)

論文(リポジトリ)
澤崎, 夏希 ; 遠藤, 聡志 ; 當間, 愛晃 ; 山田, 孝治 ; 赤嶺, 有平
出版情報: 第13回研究会オンライン・プロシーディングス.  pp.39-44,  2018-12-03.  Webインテリジェンスとインタラクション研究会
URL: http://hdl.handle.net/20.500.12000/46168
概要: 現在ディープラーニングの発展により様々な問題が解決されているが,その問題の多くは十分なデータ 量が確保されており,少量学習データでの問題解決は依然として課題となっている.データ量が少ない場合の対 策として,データを増加させるかさ増し手法が用 いられる.特に画像分野においては Generative Adversarial Network:GAN を用いた高精度な画像生成手法が注目されている.自然言語の分野においても,GAN を応用し文 章を生成する試みが広く行われているが,十分な精度の文章生成を行うのは難しい.原因の一つとして,自然言語 生成に用いられる GAN では,多くの場合構文構造は加味されていないことがあげられる.そこで,本論文では グラフ構造を畳み込む Graph Convolution を用いて,構文構造を加味した上で文章生成を行う手法を提案する.
論文
続きを見る
4.

論文(リポジトリ)

論文(リポジトリ)
澤崎, 夏希 ; 遠藤, 聡志 ; 當間, 愛晃 ; 山田, 孝治 ; 赤嶺, 有平
出版情報: 第11回研究会オンライン・プロシーディングス.  pp.41-46,  2017-12-15.  Webインテリジェンスとインタラクション研究会
URL: http://hdl.handle.net/20.500.12000/46167
概要: 機械学習アルゴリズムが特徴量そのものを学習することで様々な領域での問題解決にブレークスルーが起 こっている.テキスト分類の問題領域でも,多くの場合.高い分類精度を達成している.しかし成功例の多くは 各正解ラベルのデータ量が均一あるいはそれに 近い状態であることが多い.このため.すべての正解ラベルデー タを十分量用意するためのコストが機械学習アプローチのボトルネックとなっている.また.ラベル毎のデータ 量が不揃いな場合は不均衡データと呼ばれうまく分類できないことが知られている.本研究では,自然言語の不 均衡データに対するかさ増し手法を提案する.提案手法を用いた,不均衡データ分類問題の計算実験を行い.分 類精度の検証によってその有用性を評価する.
論文
続きを見る