ソフトウェア開発プロジェクトデータからのデータマイニング

2008年現在で最も力を入れているテーマのひとつです.

企業のソフトウェア開発現場から収集されるデータを用いて,品質や生産性向上の指針となるような分析を行っています.

ソフトウェアの開発現場におけるプロジェクトの混乱を回避するために,プロジェクトのリスク要因を抽出する手法の開発が求められています.本研究では,ソフトウェアの品質に関する指標「不具合工数密度」に関して,その改善案を開発データから抽出する手法を提案しました.具体的には,まずプロジェクトデータに相関ルールマイニングを適用することで「不具合工数密度」に影響を与える相関ルール群を抽出します.次に,抽出した相関ルール群から改善ルール(ルール中にほぼ同じメトリクスを含むが,「不具合工数密度」の評価値が異なるルール)群を特定し,その中から有用なプロジェクトの改善案を求める.本手法の提案及び適用実験は産学連携研究として行いました.適用実験として,日本国内で収集された企業横断的プロジェクトデータからのプロジェクト改善案の抽出を試みました.その結果,多くの改善案をほぼ自動的に抽出できることを確認すると同時に,その改善案が先行研究での指摘と基本的に一致することを示すことができました.

関連論文

  • 出張, 水野, 菊野, 菊地, 平山, "企業横断的データからのプロジェクト改善案の相関ルールマイニングによる抽出," 情報処理学会論文誌, 49(8), pp. 2791-2801, 2008年8月.
  • 浜野, 天嵜, 水野, 菊野, "相関ルールマイニングによるソフトウェア開発プロジェクト中のリスク要因の分析," コンピュータソフトウェア, 24(2), pp. 79-87, 2007年2月.
  • 中野, 水野, 菊野, 阿南, 田中, "コードレビューの密度と効率がコード品質に与える影響の分析," SEC journal, 2(4), pp. 10-17, 2006年11月.
  • 菊地, 安藤, 水野, 菊野, "通信ソフトウェア開発におけるプロセス改善のためのフィールド品質に注目した主要な改善活動要因の抽出," SEC journal, 2(1), pp. 26-35, 2006年1月.
  • S. Amasaki, Y. Takagi, O. Mizuno, and T. Kikuno, "Constructing a Bayesian Belief Network to Predict Final Quality in Embedded System Development," IEICE Trans. on Information and Systems, E88-D(6), pp. 1134-1141, June 2005. (JCR: 0.242 (2005))
  • S. Amasaki, T. Yoshitomi, O. Mizuno, Y. Takagi, and T. Kikuno, "A New Challenge for Applying Time Series Metrics Data to Software Quality Estimation," Software Quality Journal, 13(2), pp. 177-193, June 2005. (JCR: 0.529 (2005))
  • J. Debari, O. Mizuno, T. Kikuno, N. Kikuchi, and M. Hirayama, "On Deriving Actions for Improving Cost Overrun by Applying Association Rule Mining to Industrial Project Repository," In Proc. of International Conference on Software Process 2008 (ICSP2008), LNCS 5006, pp. 51-62, May 2008. (Leipzig, Germany) (Acceptance rate: 30%)
  • S. Amasaki, Y. Hamano, O. Mizuno, and T. Kikuno, "Characterization of Runaway Software Projects Using Association Rule Mining," In Proc. of 7th International Conference on Product Focused Software Process Improvement (PROFES2006), LNCS 4034, pp. 402-407, June 2006. (Amsterdam, The Netherlands) (Acceptance rate: 47.2%, 26/55)
  • S. Amasaki, Y. Takagi, O. Mizuno, and T. Kikuno, "A Bayesian Belief Network for Assessing the Likelihood of Fault Content," In Proc. of 14th International Symposium on Software Reliability Engineering (ISSRE2003), pp. 215-226, November 2003. (Denver, CO, USA) (Acceptance rate: 20%, 41/200)
  • O. Mizuno, E. Shigematsu, Y. Takagi, and T. Kikuno, "On Estimating Testing Effort Needed to Assure Field Quality in Software Development," In Proc. of 13th International Symposium on Software Reliability Engineering (ISSRE2002), pp. 139-146, November 2002. (Annapolis, MD, USA.) (Acceptance rate: 45%, 33/73)
  • N. Kikuchi, O. Mizuno, and T. Kikuno, "Identifying Key Attributes of Projects That Affect the Field Quality of Communication Software," In Proc. of 24th Annual International Computer Software and Applications Conference (COMPSAC2000), pp. 176-178, October 2000. (Taipei, Taiwan.)
  • O. Mizuno, T. Kikuno, K. Inagaki, Y. Takagi, and K. Sakamoto, "Analyzing Effects of Cost Estimation Accuracy on Quality and Productivity," In Proc. of 20th International Conference on Software Engineering (ICSE98), pp. 410-419, April 1998. (Kyoto, Japan.) (Acceptance rate: 19%, 41/209)
  • K. Inagaki, Y. Takagi, K. Sakamoto, and O. Mizuno, "Analyzing the Cost Estimation Accuracy in Software Project Respect to Productivity and Quality," In Proc. of International Symposium on Future Software Technology 97 (ISFST97), pp. 372-377, October 1997. (Xiamen, China.)
  • E. Choi and O. Mizuno, "Towards Quality Improvement and Analysis of Combinatorial Testing," In ウィンターワークショップ2017・イン・飛騨高山, pp. 13-14, January 2017.
  • 出張, 尾形, 菊野, 水野, 菊地, 平山, "ソフトウェア開発データに対する相関ルールマイニングを利用した不具合増加要因の調査," 情報処理学会研究報告 ソフトウェア工学(SE), 2010-SE-167(3), pp. 1-8, 2010年3月. (東京都)
  • 出張, 尾形, 菊野, 水野, 菊地, 平山, "相関ルールマイニングを利用したソフトウェアプロジェクト混乱要因の関連性に関する調査," 情報処理学会創立50周年記念全国大会(第72回全国大会), 5B-1, 2010年3月. (東京大学)
  • 出張, 菊野, 水野, 菊地, 平山, "相関ルールに対するクラスタ分析によるソフトウェアプロジェクトのリスク抽出," ウィンターワークショップ2010・イン・倉敷 論文集, pp. 115-116, 2010年1月. (倉敷)
  • 飯田, 水野, 菊野, 吉岡, 阿南, 田中, "ソフトウェアメトリクスのデータマイニングによる障害発生要因特定," 電子情報通信学会技術報告, 108(384, KBSE2008-50), pp. 79-84, 2009年1月. (東京)
  • 出張, 水野, 菊野, 菊地, 平山, "相関ルールマイニングによる企業横断データにおける不具合工数密度の分析," 電子情報通信学会技術研究報告, 107(275, SS2007-36), pp. 35-40, 2007年10月. (宮城大学)
  • 佐々木, 安部, 水野, 菊野, 吉岡, 阿南, 田中, "オーバーサンプリングを用いた効率的品質管理のための変数選択手法の提案," 電子情報通信学会技術研究報告, 107(4, SS2007-8), pp. 41-46, 2007年4月. (会津大学)
  • 浜野, 水野, 菊野, 菊地, 平山, "相関ルールマイニングの適用によるソフトウェア生産性の決定要因の分析," 情報処理学会第155回ソフトウェア工学研究会, 2007(33, 2007-SE-155), pp. 65-72, 2007年3月. (東京)
  • 金村, 水野, 菊野, 高木, 坂本, "レビュー作業の質に着目したソフトウェア最終品質の推定," 電子情報通信学会技術研究報告, 99(682-683, SS99-69), pp. 1-7, 2000年3月.
  • 稲垣, 高木, 坂本, 水野, 菊野, "ソフトウェア開発プロジェクトにおける開発計画の分析 -- 品質,生産性との関連性 --," 電子情報通信学会技術研究報告, 97(260-261, SS97-27), pp. 15-22, 1997年9月.