Tweet | |
岡嶋, 河端, 水野, "単語ベクトルを用いた省略識別子の復元手法," ソフトウェア信頼性研究会FORCE2014予稿集, 2-2, 2014年12月. | |
ID | 699 |
分類 | 研究会・全国大会等 |
タグ | ベクトル 単語 復元 手法 省略 識別子 |
表題 (title) |
単語ベクトルを用いた省略識別子の復元手法 |
表題 (英文) |
|
著者名 (author) |
岡嶋 秀記,河端 駿也,水野 修 |
英文著者名 (author) |
Hideki Okajima,Shunya Kawabata,Osamu Mizuno |
編者名 (editor) |
|
編者名 (英文) |
|
キー (key) |
Hideki Okajima,Shunya Kawabata,Osamu Mizuno |
書籍・会議録表題 (booktitle) |
ソフトウェア信頼性研究会FORCE2014予稿集 |
書籍・会議録表題(英文) |
|
巻数 (volume) |
|
号数 (number) |
2-2 |
ページ範囲 (pages) |
|
組織名 (organization) |
|
出版元 (publisher) |
|
出版元 (英文) |
|
出版社住所 (address) |
|
刊行月 (month) |
12 |
出版年 (year) |
2014 |
採択率 (acceptance) |
|
URL |
|
付加情報 (note) |
|
注釈 (annote) |
|
内容梗概 (abstract) |
ソフトウェアのソースコードの読みやすさはソースコードを保守する上でその重要な要因である.コーディングする際に単語を適切に省略することでコードを簡潔に書ける場合がある.その一方で,略語を多用すると読みにくいコードになってしまう可能性がある.そこで,ソースコードを効率よく理解するために略語を復元する技術が求められる.本稿では,「word2vec」というツールを用いて略語を元の単語に復元する手法を提案する.word2vecは文章を入力として,単語の意味を表す高次元のベクトルを作成するツールである.単語の意味をベクトルとして扱えるため,単語間の意味の距離や加減の計算が可能になる.我々はソースコードから抽出した識別子の連続を文章と見なしword2vecを適用する.得られた識別子のベクトルを用いて,ソースコード中の省略されている識別子と省略される前の識別子の候補との意味の距離を計算する.この識別子間の距離を比較することでより正確な省略される前の識別子の候補を推定する.本手法を用いて省略された識別子から省略される前の識別子を復元できることを示す. |
論文電子ファイル | published (application/pdf) [一般閲覧可] |
BiBTeXエントリ |
@inproceedings{id699, title = {単語ベクトルを用いた省略識別子の復元手法}, author = {岡嶋 秀記 and 河端 駿也 and 水野 修}, booktitle = {ソフトウェア信頼性研究会FORCE2014予稿集}, number = {2-2}, month = {12}, year = {2014}, } |