一句話概括:備份。

備份方法

  1. 線上備份
    1. 雲端硬碟
      1. Google Drive
      2. OneDrive
      3. MEGA
    2. Github
  2. 實體備份
    1. 硬碟
    2. NAS

備份原則

3-2-1 備份原則

  • 至少製作三份備份
    • 即資料至少要同時存在四份
  • 將備份存放在兩個不同的儲存媒體
    • 不要放在同一顆硬碟
  • 至少一份放在異地保存

至少一個冷備份

  • 僅在定期備份時通電使用,日常都是斷電儲存狀態,儲存壽命會較久
  • 斷電斷網,可以避免WannaCry等惡意軟體

版本控制

  • 記錄資料的歷史版本
  • 可以回復之前的修改
  • 增量備份、差異備份

備份頻率依下列標準決定

  • 資料重要程度
  • 資料的更新頻率

資料重要性分類

  1. 自有資料:自己的照片、檔案等
    1. 有唯一性,無法從其他地方獲取
  2. 難以獲得:公司的資料、私人分享資料
    1. 可以取得,但不夠方便
  3. 容易獲得:公開的軟體、影片、書籍等
    1. 不太需要備份

實作

目前使用的方式

電腦

除了使用中電腦的資料外,還有三份備份

  1. 外接硬碟
  2. 雲端硬碟
  3. NAS

使用專用軟體同步

手機

定期備份至電腦,使用相同方法備份即可

有這麼簡單嗎?

並沒有

像是在線服務(SaaS)的資料,如Youtube、Facebook、Twitter、Evernote、Spotify等

可能有人會想到:「這些網站大多有匯出資料的功能阿!」

但是就算有備份、可以匯出資料,也不一定能還原所有資料。

舉例來說,你能夠重新上傳影片,但是訂閱人數、觀看人數、按讚、留言全部歸零
就算有備份留言,也沒辦法還原到新影片中。

而且各平台判斷違規的標準不明確、也沒有具體規定,舉下列平台為例:

  • Facebook
    • 由人工審核
      • 所以常有不明原因被封鎖的事件發生
  • Youtube/Twitch
    • 影片侵權和違規/黃標標準由AI判斷
      • AI的正確率並非100%,所以有時連大頻道都會被Ban
      • 有時被惡意檢舉過多也會被ban
      • 舉例:さくらみこYoutube頻道曾被ban過
      • 間接使各個Youtuber自我審查
  • Twitter
    • 川普被封鎖貼文及帳號,原因是煽動暴力
    • 希望馬斯克買下以後(?)能公開篩選演算法
  • 巴哈姆特(🆕)
    • 由於中介法的爭議,開始限制政治言論
    • 但是之前有許多反藍言論,有雙標的嫌疑
  • Google(🆕)

解決方法

  • 用相對開放、規範較少的平台
    • 有人在P站放微積分教學影片
  • 自建平台(私有雲)

網站備份指南

  • 非常危險:愈快備份愈好
    • 大部份的中國網站
      • 內容常會因為「違反國家法規」而消失
      • Bilibili
      • 知乎
  • 危險:一個月備份一次
    • 用戶提供內容的平台
    • 原因
      • 內容被惡意檢舉
      • 平台有權下架內容/禁止帳號
      • 發表者自行刪除
      • 社群網站
        • Facebook
        • Twitter
      • 直播、影片
        • Youtube
        • Twitch
      • 部落格(網誌)
        • Pixnet
        • Medium
      • 圖片
        • Pixiv
        • Instagram
        • Imgur
  • 一般:三個月備份一次
    • 第三方提供內容的平台
    • 使用者付費平台
    • 原因
      • 內容授權過期
      • 平台倒閉風險
      • 音樂串流
        • Spotify
      • 電視劇
        • Netflix
        • Disney+
      • 動畫
        • 巴哈姆特動畫瘋
  • 安全:六個月~三年備份一次
    • 幾乎沒有付費關係的企業
    • 原因
      • 企業需要用戶(的資料賺錢)
      • 帳號被封鎖的風險較低
      • Google相關服務(不含Youtube)
      • Microsoft
  • 非常安全:不需刻意備份
    • 區塊鏈
    • 金融業
      • 銀行帳戶/投資的交易記錄
      • 如果會怕的話,可以用存摺備份
    • PTT
      • 因為其非盈利性質,有許多網站有備份,包含被刪除的文章
    • 數位版遊戲(不包含存檔)
      • 因為有盜版的存在
    • Github

總結

隨著科技的進步,資料傳播的速度和數量都大幅提升,然而資料本身卻變得非常脆弱;像是硬碟比書的壽命短,而且容易失效。

任何程式設計師,一個月寫出的程式碼的價值都已經遠超過任何備份方式需要的花費。

但目前還沒有完美的辦法能避免全lost(尤其是將資料放在線上的服務),只能降低風險。

參考資料