研究会・全国大会等
inproceedings
単語ベクトルを用いた省略識別子の復元手法
  • URLがありません
概要

ソフトウェアのソースコードの読みやすさはソースコードを保守する上でその重要な要因である.コーディングする際に単語を適切に省略することでコードを簡潔に書ける場合がある.その一方で,略語を多用すると読みにくいコードになってしまう可能性がある.そこで,ソースコードを効率よく理解するために略語を復元する技術が求められる.本稿では,「word2vec」というツールを用いて略語を元の単語に復元する手法を提案する.word2vecは文章を入力として,単語の意味を表す高次元のベクトルを作成するツールである.単語の意味をベクトルとして扱えるため,単語間の意味の距離や加減の計算が可能になる.我々はソースコードから抽出した識別子の連続を文章と見なしword2vecを適用する.得られた識別子のベクトルを用いて,ソースコード中の省略されている識別子と省略される前の識別子の候補との意味の距離を計算する.この識別子間の距離を比較することでより正確な省略される前の識別子の候補を推定する.本手法を用いて省略された識別子から省略される前の識別子を復元できることを示す.
ファイル

published
BibTeX

Copyright © 2025 omzn.aquatan.net a.k.a. Osamu Mizuno All rights reserved.

ここのリストで表示される文献は,SEL@KIT在籍者に関連するもののみになります.