生データを収集し、機械学習用にデータ処理したものが「学習データセット」である。
機械学習には、学習させるためのデータが必要になる。このデータを「訓練データ」、抽出された規則性やパターンを「学習モデル」と呼ぶ。学習データセットの重要性は高まっている。※I):二〇一六年一月、米Yahooは過去最大級(十三・五テラバイト)の機械学習データセットを公開した。Yahoo Labsの「Webscope」で利用することができる。
■参考文献
次世代人工知能研究のための標準データ・セット~人工知能技術コンソーシアム~(人工知能研究センターが公開しているPDF文書)
★この記事はiCardbook、『人工知能と商業デザイン』を構成している「知識カード」の一枚です。
アイカードブック(iCardbook)
この記事を読んだ人は、こんな記事も読んでいます
註
I. | 戻る | :二〇一六年一月、米Yahooは過去最大級(十三・五テラバイト)の機械学習データセットを公開した。Yahoo Labsの「Webscope」で利用することができる。 |