新增資料集

[!NOTE] Aralia提供雲端服務及本地安裝,目前雲端服務不提供星球擁有者相關功能,若您有本地安裝需求,請聯繫業務/客服取得安裝包。

數據星球目前僅提供上傳csv檔案的形式新增資料集,僅有Owner或是Co-Owner擁有新增資料集的權限。

資料集和檔案的關係

每一個資料集是由一至多個csv檔案上傳組成,可以一次上傳多個檔案,每一個檔案限制45MB,您可以當有新的檔案時,就將檔案上傳到數據星球對應的資料集,使資料集保持有最新的資料可以使用。

新增資料集流程

STEP 1:請先登入數據星球後前往「數據管理」

請點選上方「數據管理」按鈕進入。 createdataset

STEP 2:新增資料集

您可以透過兩種方式新增資料集: createdataset

  • 在側邊欄的分類名稱上右鍵選擇「新增資料集」
  • 右上點擊「建立新資料集」按鈕

STEP 3:輸入資料集名稱和選擇檔案

在彈出視窗中,請為此資料集指定名稱。 createdataset

並拖入或選擇要上傳的CSV檔案,可以一次選擇多個,若是您的CSV檔案第一行是欄位名稱,請選擇包含標題,若檔案無包含標題,請關閉。完成後請點選上傳。

[!NOTE] 數據星球會依照您的csv內容來判斷每個變數的型態,若是不符合您的預期可以透過編輯資料集功能調整。

createdataset

[!WARNING] 您上傳檔案後,數據星球會在背景處理您的數據,當完成時會有彈出視窗提醒您已經完成。

刪除資料集流程

STEP 1:請先登入數據星球後前往「數據管理」

請點選上方「數據管理」按鈕進入。 createdataset

STEP 2:刪除資料集

在左側要刪除的資料集點選右鍵,選擇「刪除」。 createdataset

了解上傳失敗的原因

當您已上傳CSV後發生失敗,您可以使用檔案管理功能了解失敗的原因。

STEP 1:發生上傳失敗

createdataset

STEP 2:進入檔案管理

選擇資料集,點選「資料集設定」下拉選單中的「檔案管理」 createdataset

STEP 3:到失敗的檔案了解原因

找到失敗的檔案紀錄,滑鼠移到「i」上會看到失敗的原因。 createdataset

資料集變數型態判斷規則

在數據星球創建新的資料集時,會以CSV檔案的內容,判斷每一個變數的型態,以下是判斷的規則:

數據星球
數據型態
判斷方法
數值
(整數)
每個值都是數值,若是數值中有逗號也判斷為整數數值,例如1,234。
數值
(小數點)
每個值都是數值,且部分有小數點。
無序類別 值的重複程度高,先以總筆數為不重複個數10倍以上作為重複高的基準,且原始數據是文字。
有序類別 (初始判斷時不會判斷成有序,都以無序為主)。
文字 值的重複程度低,且最長文字少於30字(一個中文字算3個字)。
長篇文字 值的重複程度低,且最長文字超過30字(一個中文字算3個字)。
日期 所有的值符合以下格式:請參考附錄
日期時間 所有的值符合以下格式:請參考附錄
經緯度
(點數據)
WKT格式或是geojson格式的點數據。
WKT格式:POINT (30 10)
Geojson格式:{"type": "Point", "coordinates": [30, 10]}
經緯度
(線數據)
WKT格式或是geojson格式的線數據。
WKT格式:LINESTRING (30 10, 10 30, 40 40)
Geojson格式:{"type": "LineString", "coordinates": [[30, 10], [10, 30], [40, 40]]}
經緯度
(面數據)
WKT格式或是geojson格式的面數據。
WKT格式:POLYGON ((30 10, 40 40, 20 40, 10 20, 30 10))
Geojson格式:{"type": "Polygon", "coordinates": [[[30, 10], [40, 40], [20, 40], [10, 20], [30, 10]]]}
  • 以下兩種情況被判斷為NULL
    • ,, (分隔符號間無字元)
    • 值為NULL,null,Null,NA,na,Na,N/A,N/a,n/A,n/a,None,none,NONE
  • 若是csv中該欄位全部為空,將會是「未定義」型態。
Copyright © 2024 BigObject Private Limited all right reserved,powered by GitbookFile Modify: 2024-03-28 10:47:13

results matching ""

    No results matching ""