Hideki Okajima,Osamu Mizuno
岡嶋 秀記,水野 修
Hideki Okajima,Osamu Mizuno
電子情報通信学会技術研究報告
IEICE Technical Report
702
3
那覇市, 沖縄県
SS2014-68
79-84
3
機械学習を用いた省略識別子の復元手法
An Approach for Abbreviated Identifier Expansion with Machine Learning
114
2015
Hideki Okajima,Shunya Kawabata,Osamu Mizuno
ソフトウェアのソースコードの読みやすさはソースコードを保守する上でその重要な要因である.コーディングする際に単語を適切に省略することでコードを簡潔に書ける場合がある.その一方で,略語を多用すると読みにくいコードになってしまう可能性がある.そこで,ソースコードを効率よく理解するために略語を復元する技術が求められる.本稿では,「word2vec」というツールを用いて略語を元の単語に復元する手法を提案する.word2vecは文章を入力として,単語の意味を表す高次元のベクトルを作成するツールである.単語の意味をベクトルとして扱えるため,単語間の意味の距離や加減の計算が可能になる.我々はソースコードから抽出した識別子の連続を文章と見なしword2vecを適用する.得られた識別子のベクトルを用いて,ソースコード中の省略されている識別子と省略される前の識別子の候補との意味の距離を計算する.この識別子間の距離を比較することでより正確な省略される前の識別子の候補を推定する.本手法を用いて省略された識別子から省略される前の識別子を復元できることを示す.
岡嶋 秀記,河端 駿也,水野 修
Hideki Okajima,Shunya Kawabata,Osamu Mizuno
ソフトウェア信頼性研究会FORCE2014予稿集
699
12
2-2
3
単語ベクトルを用いた省略識別子の復元手法
2014
Hideki Okajima
岡嶋 秀記
Hideki Okajima
708
2
7
京都工芸繊維大学大学院工芸科学研究科
単語ベクトルによる省略識別子の復元推定手法に関する研究
2015