Tweet | |
田中, 水野, "畳み込みニューラルネットワークを用いたコード片からのプログラミング言語識別," 電子情報通信学会技術報告, 116(426, SS2016-57), pp. 123-128, 2017年1月. | |
ID | 744 |
分類 | 研究会・全国大会等 |
タグ | コード ニューラルネットワーク プログラミング 片 言語 識別 |
表題 (title) |
畳み込みニューラルネットワークを用いたコード片からのプログラミング言語識別 |
表題 (英文) |
|
著者名 (author) |
田中 健太郎,水野 修 |
英文著者名 (author) |
Kentaro Tanaka,Osamu Mizuno |
編者名 (editor) |
|
編者名 (英文) |
|
キー (key) |
Kentaro Tanaka,Osamu Mizuno |
書籍・会議録表題 (booktitle) |
電子情報通信学会技術報告 |
書籍・会議録表題(英文) |
|
巻数 (volume) |
116 |
号数 (number) |
426, SS2016-57 |
ページ範囲 (pages) |
123-128 |
組織名 (organization) |
|
出版元 (publisher) |
|
出版元 (英文) |
|
出版社住所 (address) |
|
刊行月 (month) |
1 |
出版年 (year) |
2017 |
採択率 (acceptance) |
|
URL |
|
付加情報 (note) |
京都市 |
注釈 (annote) |
|
内容梗概 (abstract) |
プログラミング技術に関するナレッジコミュニティとして最も有名なものの一つに Stack Overflow がある. ここでは,プログラミングに関する質問が投稿されると,それに対して回答が寄せられる. 投稿される質問や解答に はしばしば snippet と呼ばれるテキスト片が含まれている.このテキスト片は一般的にはソースコードの断片であり, ソフトウェアにおけるバグやその修正を分析する上で,非常に有用なデータセットとなりうる.しかし,snippet に は目的のプログラミング言語以外で記述されたテキストもしばしば含まれているため,そのままでは正確なデータと して用いることができない.この問題を解決するためには,「snippet がソースコードであるかどうか」,そして,「ど のプログラミング言語によって記述されたソースコードであるかどうか」を識別する必要がある.本報告では,これ らの snippet に対して,畳み込みニューラルネットワークを用いたプログラミング言語の識別方法を提案した. Stack Overflow から取得できるオープンデータを用いた実験より,プログラミング言語の分類,及び,snippet から目的のプ ログラミング言語以外の snippet の除外が可能であることを確認した. |
論文電子ファイル | draft (application/pdf) [一般閲覧可] |
BiBTeXエントリ |
@inproceedings{id744, title = {畳み込みニューラルネットワークを用いたコード片からのプログラミング言語識別}, author = {田中 健太郎 and 水野 修}, booktitle = {電子情報通信学会技術報告}, volume = {116}, number = {426, SS2016-57}, pages = {123-128}, month = {1}, year = {2017}, note = {京都市}, } |