新增資料集
[!NOTE] Aralia提供雲端服務及本地安裝,目前雲端服務不提供星球擁有者相關功能,若您有本地安裝需求,請聯繫業務/客服取得安裝包。
數據星球目前僅提供上傳csv檔案的形式新增資料集,僅有Owner或是Co-Owner擁有新增資料集的權限。
資料集和檔案的關係
每一個資料集是由一至多個csv檔案上傳組成,可以一次上傳多個檔案,每一個檔案限制45MB,您可以當有新的檔案時,就將檔案上傳到數據星球對應的資料集,使資料集保持有最新的資料可以使用。
新增資料集流程
STEP 1:請先登入數據星球後前往「數據管理」
請點選上方「數據管理」按鈕進入。
STEP 2:新增資料集
您可以透過兩種方式新增資料集:
- 在側邊欄的分類名稱上右鍵選擇「新增資料集」
- 右上點擊「建立新資料集」按鈕
STEP 3:輸入資料集名稱和選擇檔案
在彈出視窗中,請為此資料集指定名稱。
並拖入或選擇要上傳的CSV檔案,可以一次選擇多個,若是您的CSV檔案第一行是欄位名稱,請選擇包含標題,若檔案無包含標題,請關閉。完成後請點選上傳。
[!NOTE] 數據星球會依照您的csv內容來判斷每個變數的型態,若是不符合您的預期可以透過編輯資料集功能調整。
[!WARNING] 您上傳檔案後,數據星球會在背景處理您的數據,當完成時會有彈出視窗提醒您已經完成。
刪除資料集流程
STEP 1:請先登入數據星球後前往「數據管理」
請點選上方「數據管理」按鈕進入。
STEP 2:刪除資料集
在左側要刪除的資料集點選右鍵,選擇「刪除」。
了解上傳失敗的原因
當您已上傳CSV後發生失敗,您可以使用檔案管理功能了解失敗的原因。
STEP 1:發生上傳失敗
STEP 2:進入檔案管理
選擇資料集,點選「資料集設定」下拉選單中的「檔案管理」
STEP 3:到失敗的檔案了解原因
找到失敗的檔案紀錄,滑鼠移到「i」上會看到失敗的原因。
資料集變數型態判斷規則
在數據星球創建新的資料集時,會以CSV檔案的內容,判斷每一個變數的型態,以下是判斷的規則:
數據星球 數據型態 |
判斷方法 |
---|---|
數值 (整數) |
每個值都是數值,若是數值中有逗號也判斷為整數數值,例如1,234。 |
數值 (小數點) |
每個值都是數值,且部分有小數點。 |
無序類別 | 值的重複程度高,先以總筆數為不重複個數10倍以上作為重複高的基準,且原始數據是文字。 |
有序類別 | (初始判斷時不會判斷成有序,都以無序為主)。 |
文字 | 值的重複程度低,且最長文字少於30字(一個中文字算3個字)。 |
長篇文字 | 值的重複程度低,且最長文字超過30字(一個中文字算3個字)。 |
日期 | 所有的值符合以下格式:請參考附錄 |
日期時間 | 所有的值符合以下格式:請參考附錄 |
經緯度 (點數據) |
WKT格式或是geojson格式的點數據。 WKT格式:POINT (30 10) Geojson格式:{"type": "Point", "coordinates": [30, 10]} |
經緯度 (線數據) |
WKT格式或是geojson格式的線數據。 WKT格式:LINESTRING (30 10, 10 30, 40 40) Geojson格式:{"type": "LineString", "coordinates": [[30, 10], [10, 30], [40, 40]]} |
經緯度 (面數據) |
WKT格式或是geojson格式的面數據。 WKT格式:POLYGON ((30 10, 40 40, 20 40, 10 20, 30 10)) Geojson格式:{"type": "Polygon", "coordinates": [[[30, 10], [40, 40], [20, 40], [10, 20], [30, 10]]]} |
- 以下兩種情況被判斷為NULL
- ,, (分隔符號間無字元)
- 值為NULL,null,Null,NA,na,Na,N/A,N/a,n/A,n/a,None,none,NONE
- 若是csv中該欄位全部為空,將會是「未定義」型態。