ソフトウェアの開発において,工数予測は重要な課題である.工数予測の手法としては,回帰分析などを 用いてソフトウェアメトリクスからモデルを作成する研究が行われている.ここで,サンプル数の不足などから企業 横断的 (Cross-Company) データセットが,モデル作成に用いられることがあるが,このデータセットが工数予測に対 して良いデータセットなのか悪いデータセットなのかを判断することは難しい.本報告では,因果関係推定手法を用 いた新しい工数データセットの評価指標を提案した.オープンデータを用いた実験より,我々の評価指標は正しく工 数データセットの良さを評価できていることを確認した.