深度學習筆記:

day1:

一、結構化數據和非結構化數據

結構化數據

結構化數據,是指由二維表結構來邏輯表達和實現的數據,嚴格地遵循數據格式與長度規範,主要通過關係型數據庫進行存儲和管理。也稱作行數據,一般特點是:數據以行爲單位,一行數據表示一個實體的信息,每一行數據的屬性是相同的。

 比如:
1 張一 female 3337899 湖北省武漢市

非結構化數據

非結構化數據,是數據結構不規則或不完整,沒有預定義的數據模型,不方便用數據庫二維邏輯表來表現的數據。包括所有格式的辦公文檔、文本、圖片、HTML、各類報表、圖像和音頻/視頻信息等等。

半結構化數據

半結構化數據,是結構化數據的一種形式,雖不符合關係型數據庫或其他數據表的形式關聯起來的數據模型結構,但包含相關標記,用來分隔語義元素以及對記錄和字段進行分層。因此,也被稱爲自描述的結構。

常見的半結構數據有XML和JSON,比如:

<person>
 
    <name>A</name>
 
    <age>13</age>
 
    <gender>female</gender>
 
</person>

————————————————
版權聲明:本文爲CSDN博主「alice_tl」的原創文章,遵循 CC 4.0 BY-SA 版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/alice_tl/article/details/88142721

2、對訓練集、驗證集和測試集的理解

https://blog.csdn.net/kieven2008/article/details/81582591

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章