Pandas 處理數據

可簡化把Pandas Dataframe想為Excel 的工作表

前篇我們把數據放進 命名為 df 的 pandas Dataframe, 也預覽內容如下:

Under Construction


Row 0 很明顯是欄位英文翻譯, 要拿掉


  1. "非都市土地使用分區", "非都市土地使用編定" 有缺值 (NaN), 我們必須有策略來因應


  1. 許多欄位是類別式型態 如: "主要建材", "交易標的", "轉移層次" 等等, 需要編碼

  2. "交易年月日", "建築完成年月日" 要由民國字串 轉為程式可計算的時間

以下我們逐步說明細節, 而通常在Python 會利用 Pandas, Numpy 提供的功能函數來處理