ソフトウェアのバグが報告されると,開発者はバグ修正のためにバグに関連するソースコードファイルを特定する必要がある.この過程は,不具合ファイル特定と呼ばれ,不具合ファイル特定の自動化は開発者の生産性向上のために重要である.本研究では,単語分散表現作成のための自然言語処理ツールword2vecによって学習されるベクトル空間モデルsemantic-VSMを用いて,与えられたバグ報告に対する不具合ファイル特定を効果的に行う手法を提案する.また,不具合ファイル特定の正答率を向上させるために,semantic-VSMとともに既存の不具合ファイル特定手法BugLocator及びBugspotsを組み合わせて用いる手法CombBLを紹介する.我々の実験結果は,提案手法の正答率が既存の高水準の不具合ファイル特定手法と比べて大幅には劣らない結果を達成していることを示す.また我々は,提案手法が既存手法に比べてスケーラビリティ及び高速さにおいては優れている点について考察した.
研究発表
- Y. Uneno, O. Mizuno, and E. Choi, "Using a Distributed Representation of Words in Localizing Relevant Files for Bug Reports," In Proc. of the 2016 IEEE International Conference on Software Quality, Reliability & Security (QRS2016), pp. 183-190, August 2016.
- 釆野, 水野, 崔, "Word2Vecを用いたバグ報告からの不具合ファイル特定," 電子情報通信学会技術研究報告, 115(SS2015-85), pp. 55-60, 2016年3月.
- 釆野, "単語分散表現を用いたバグ報告からの不具合ファイル特定," 修士学位論文, 京都工芸繊維大学大学院工芸科学研究科, 2016年.
- 釆野, 水野, "Word2Vecを利用したバグ報告に対する修正対象推薦手法," ソフトウェア信頼性研究会FORCE2015予稿集, 2015年11月.
- Y. Uneno and O. Mizuno, "Identifying Bug Injected Files from Bug Description Using Word2vec," In Poster presentation of 6th International Workshop on Empirical Software Engineering in Practice (IWESEP2014), November 2014.