データセット

生データを収集し、機械学習用にデータ処理したものが「学習データセット」である。

機械学習には、学習させるためのデータが必要になる。このデータを「訓練データ」、抽出された規則性やパターンを「学習モデル」と呼ぶ。学習データセットの重要性は高まっている。※I):二〇一六年一月、米Yahooは過去最大級(十三・五テラバイト)の機械学習データセットを公開した。Yahoo Labsの「Webscope」で利用することができる。

■参考文献
次世代人工知能研究のための標準データ・セット~人工知能技術コンソーシアム~人工知能研究センターが公開しているPDF文書)

◎関連知識カード:人工知能ビッグデータ


★この記事はiCardbook、『人工知能と商業デザイン』を構成している「知識カード」の一枚です。

アイカードブック(iCardbook)   

 

   [ + ]

I. :二〇一六年一月、米Yahooは過去最大級(十三・五テラバイト)の機械学習データセットを公開した。Yahoo Labsの「Webscope」で利用することができる。