23. 印刷格物致知
          23.3. PDF
              23.3.1. PDF介紹
 23.3.1.1. PDF格式與其他文件格式

其他有一些檔案格式也辦到類似 PDF 的事情,以下列舉了其中的一部份並試著解釋這些替代品的差異或相似之處,以下分別說明:

PDF 與 XPS

XPS 是迄今為止有上市而且最近似於 PDF 的替代格式,這裡可以找到更多有關的 XPS 的資訊,該網頁亦包含這兩個檔案格式間的比較。

PDF 與 PostScript

PDF 格式是由 Adobe 公司所開發,PostScript 也是該公司開發,事實上,PDF 格式是基於 PostScript 而發展出,它以不同的方式採用了 PostScript 的指令集,PostScript 是個貨真價實的程式語言,甚至可以用來寫象棋程式或文字處理器,PDF 之目標則是比較有限,它只是描述了文件內的版面佈局(使用 PostScript 運算元),因此 PDF 格式類似於一個資料庫,而不是一種程式語言。

PDF 優於 PostScript 的主要要點是:

  • 因為可以使用有效率的壓縮演算法,PDF 檔案傾向較小
  • 使用 Acrobat 或其他工具 PDF 檔案可以很容易地檢視
  • 只要有適合的工具,PDF 檔案比較容易修改
  • PDF 更具與輸出設備無關性,PostScript 文件常常是為某一特定的輸出設備創造,如果發送到其他輸出設備將會產生 PostScript 錯誤
  • PDF 可以比 PostScript 更靈活:它們可以包含鏈結到其他資料以及多媒體元素

PDF 與 HTML

PDF 常被拿來與製作網頁使用的資料格式 HTML 來比較,原本 HTML 是被設計作為描述文件的結構,而不是它的外觀;網頁的外觀取決於瀏覽器,而不完全由文件製作者決定;隨著網際網路的日益普及,新版本的 HTML 較著重於網頁的視覺方面,而不是其內容,因此在某種意義上說,HTML 移動目標到 PDF 試圖想達到的目的。

同時間內,Adobe 把越來越多的網路功能放入 PDF 格式內,我們可以在 PDF 內加上在網際網路的聯結之選項,如 Netscape Navigator 或 Internet Explorer 網頁瀏覽器中有一個 Acrobat Reader 插件以能在瀏覽器內觀看 PDF,Acrobat 內有一個選項可以轉換一整個網站或是部分網站成為一個 PDF 檔案,Adobe 公司也提供了一個 PDF 位元組資料分段下載的機制,所以不需要下載整個 PDF 檔案就可以看到文件的第一頁。

所以 PDF 和 HTML 都成為有競爭性的標準,現在描述文件的外觀上 PDF 格式依然較為強大,而 HTML 則更適合低速上網。但若要在網站使用 PDF 或是在 CD-ROM 上的電子型錄使用 HTML 也是完全可行的。

PDF 與 XML

XML (eXtensible Markup Language,可擴展標記語言)是一種可以用來描述內容的文件(類似 SGML)的數據格式,最近它得到許多注視的目光,主要是因為它很容易地與資料庫整合、網路出版與交換資料的靈活性,XML 並非真正的與 PDF 格式競爭,而是強化了 PDF;XML 描述文件的內容,PDF 格式描述它的外觀;通常要從一個 PDF 萃取文件的內容並不是那麼地容易,至少是要花一點力氣的工作,因為在建立 PDF 檔案時整個文件的結構會遺失。

有意思的是,PDF 1.3 引入一個機制(一個結構樹)可以包含類似 XML 的資料,所以從理論上說,有可能創作一個 PDF 文件同時包含文件內容之結構性的大綱以及詳盡頁面外觀佈局,不幸的是,還沒有任何上市之嵌入 XML 數據到 PDF 檔案(使用 pdfmarks)的軟體(例如 XPress 的插件程式),Acrobat 插件從一個結構樹萃取資料並匯出到一個 XML 兼容的檔案之發展也仍處於初創階段,如果同時需要有 XML 和 PDF,當下唯一的辦法就是從版面編輯應用程式或是從資料庫出版系統中製作兩個獨立的文件。

2006 年,Adobe 實驗室出版 Mars(一種在 XML 文件中表示 PDF 的方法)的首次規格,Acrobat 8 包括 Mars 的支援,但目前該技術仍未被使用。

PDF 與 Acrobat

很多人似乎混淆 PDF 與 Acrobat 了,PDF 是資料格式,Acrobat 是 Adobe 銷售的軟體,能產生、檢視和處理 PDF 檔案;這種混亂似乎是源於一個事實,即每一個新版本的 PDF 格式的規格發布時同時帶動了一個新版本的 Acrobat,1.2 版的 PDF 格式的規格是伴隨著 Acrobat 3,PDF 1.3 首次於 Acrobat 4 推出等等。

Table of contents