PMAN4 - SEL@KIT

Workshop

article

Identifying Fault-Prone Tokens in Source Code Modules with Spam-Filtering Technique

May 2008
Technical Report of IEICE / 108(64, SS2008-4) / pp. 19-24 /
Ryosuke Morii
Osamu Mizuno
Tohru Kikuno

No URL available

Abstract

不具合が混入していそうなモジュール(Fault-prone(FP)モジュール)の検出はソフトウェアテストにおける重要な問題の一つである．これまでにも多くの研究が行われてきたが，それらの多くはソフトウェアメトリクスを利用して予測を行うため，メトリクスの収集環境が必要であった．そこで，我々は「Fault-prone フィルタリング」という手法を提案している．この手法ではモジュールを単にテキストと見なし，ベイズの定理を用いたテキスト分類技術を利用して予測を行うため，メトリクスの収集や測定を行う必要がない．しかし，この手法のこれまでの実装ではモジュール単位でFPか否かの予測を行うことはできるが，モジュールのどの部分が不具合に関連していそうなのかという具体的な情報を入手することはできなかった．そこで本論文ではモジュール単位に加え，トークン単位でもFPか否かを予測し，ソースコード中における不具合の可能性が高いトークンを推定するツールを試作した．また，適用実験としてオープンソースソフトウェアeclipseの関連プロジェクトを対象とし，トークン単位での予測精度の測定を行った．