3/19/2014

Dublin Core Metadata

3. Dublin Core Metadata
(Tham khảo: http://dublincore.org/)
3.1. Giới thiệu
Dublin Core Metadata là một trong những sơ đồ yếu tố siêu dữ liệu phổ biến và được nhiều người biết đến. Bộ yếu tố này được hình thành lần đầu tiên vào năm 1995 bởi Sáng kiến Yếu tố Siêu dữ liệu Dublin Core (Dublin Core Metadata Element Initiative). Tập hợp yếu tố siêu dữ liệu này được gọi là “cốt lõi” (core) vì nó được thiết kế đơn giản và chỉ bao gồm 15 yếu tố mô tả cốt lõi nhất (trong khi Marc21 có hơn 200 trường và rất nhiều trường con).

Tháng 9/2001 bộ yếu tố siêu dữ liệu Dublin Core được ban hành thành tiêu chuẩn Mỹ, gọi là tiêu chuẩn “The Dublin Core Metadata Element Set” ANSI/NISO Z39.85-2001. (tham khảo: http://www.niso.org/standards/resources/Z39-85.pdf)
Bộ yếu tố siêu dữ liệu Dublin Core lúc đầu được thiết kế chủ yếu cho mục đích mô tả. Các yếu tố siêu dữ liệu Dublin Core có những ưu điểm sau:
Tạo lập và sử dụng dễ dàng: cho phép những người không chuyên nghiệp có thể tạo các bản ghi mô tả đơn giản cho các tài nguyên thông tin và truy xuất chúng trên môi trường mạng một cách dễ dàng.
Ngữ nghĩa dễ hiểu, sử dụng đơn giản: Việc khai thác thông tin trên mạng internet diện rộng thường gặp trở ngại bởi những sự khác nhau về thuật ngữ và sự mô tả thực tế. Dublin Core Metadata giúp những người dò tìm thông tin không chuyên có thể tìm thấy vấn đề mình quan tâm bằng cách hỗ trợ một tập hợp các phần tử thông dụng mà ngữ nghĩa của chúng được hiểu phổ biến.
+ Phạm vi phổ biến: Tập hợp các phần tử Dublin Core Metadata lúc đầu được phát triển bằng tiếng Anh, nhưng hiện nay nó được câp nhật thêm với khoảng 25 ngôn ngữ khác nhau (phiên bản v1.1)
+ Tính mở rộng: Những nhà phát triển Dublin Core đã cung cấp một cơ chế cho việc mở rộng tập các phần tử Dublin Core, phục vụ nhu cầu khai thác các tài nguyên bổ sung. Các phần từ Metadat từ những tập các phần tử khác nhau có thể liên kết với metadata của Dublin Core. Điều này cho phép các tổ chức khác nhau có thể dùng các phần tử Dublin Core để mô tả thông tin thích hợp cho việc sử dụng tài nguyên trên Internet.
+ Giúp nâng cao độ chính xác của định chỉ số
+ Có khả năng liên tác (Interoperability), sử dụng lẫn nhau
+ Mở rộng thuận lợi

Mỗi yếu tố Dublin Core được đặt tên (Element Name) và quy định nhãn (label) để sử dụng ghi vào trong thẻ meta. Mỗi yếu tố được định nghĩa cụ thể để mô tả đối tượng và có chú thích rõ ràng.
3.2. Dublin Core Metadata bao gồm 15 yếu tố sau:
1. Nhan đề (Title): Nhan đề của tài liệu
2. Tác giả (Creator): Tác giả của tài liệu, bao gồm cả tác giả cá nhân và tác giả tập thể.
3. Chủ đề (Subject): Chủ đề tài liệu đề cập dùng để phân loại tài liệu. Có thể thể hiện bằng từ, cụm từ/(Khung chủ đề), hoặc chỉ số phân loại/ (Khung phân loại).
4. Tóm tắt (Description): Tóm tắt, mô tả nội dung tài liệu. Có thể bao gồm tóm tắt, chú thích, mục lục, đoạn văn bản để làm rõ nội dung...
5. Nhà xuất bản (Publisher): Nhà xuất bản, nơi ban hành tài liệu có thể là tên cá nhân, tên cơ quan, tổ chức, dịch vụ...
6. Tác giả phụ (Contributor): Tên những người cùng tham gia cộng tác đóng góp vào nội dung tài liệu, có thể là cá nhân, tổ chức...
7. Ngày tháng (Date): Ngày, tháng ban hành tài liệu. Có thể dùng chuẩn ISO 8601 (http://www.w3.org/TR/NOTE-datetime)
8. Loại (kiểu) (Type): Mô tả bản chất của tài liệu. Dùng các thuật ngữ mô tả phạm trù kiểu: trang chủ, bài báo, báo cáo, từ điển...
9. Khổ mẫu (Format): Mô tả sự trình bày vật lý của tài liệu, có thể bao gồm; vật mang tin, kích cỡ độ dài, kiểu dữ liệu (.doc, .html, .jpg, xls, phần mềm....)
10. Định danh (Identifier): Các thông tin về định danh tài liệu, các nguồn tham chiếu đến, hoặc chuỗi ký tự để định vị tài nguyên: URL (Uniform Resource Locators) (bắt đầu bằng http://), URN (Uniform Resource Name), ISBN (International Standard Book Number), ISSN (International Standard Serial Number), SICI (Serial Item & Contribution Identifier), ...
11.Nguồn (Resource): Các thông tin về xuất xứ của tài liệu, tham chiếu đến nguồn mà tài liệu hiện mô tả được trích ra/tạo ra, nguồn cũng có thể là: đường dẫn (URL), URN, ISBN, ISSN...
12. Ngôn ngữ (Language): Các thông tin về ngôn ngữ, mô tả ngôn ngữ chính của tài liệu: Có thể sử dụng chuẩn ISO 639 ( tham khảohttp://www.w3.org/WAI/ER/IG/ert/iso639.htm) để mô tả ngôn ngữ cho tài liệu.
13. Liên kết (Relation): Mô tả các thông tin liên quan đến tài liệu khác. có thể dùng đường dẫn (URL), URN, ISBN, ISSN...
14. Diện bao quát (Coverage): Các thông tin liên quan đến phạm vi, quy mô hoặc mức độ bao quát của tài liệu. Phạm vi đó có thể là địa điểm, không gian hoặc thời gian, tọa độ...
15. Bản quyền (Right): Các thông tin liên quan đến bản quyền của tài liệu


3.3. Cú pháp của Dublin Core
Các phần tử Dublin Core được chèn vào phần giữa các thẻ (tags)và. Cú pháp chung nhất cho Dublin Core như sau:
content= “giá trị trường”>
Chú ý: Mỗi phần tử có thể tùy chọn và có thể lặp, trong một thẻ meta có thể chứa nhiều thuộc tính , mỗi thuộc tính được cách nhau bằng dấu “;”.
Ví dụ:  Một biểu ghi Dublin Core hoàn chỉnh được gắn vào ngôn ngữ HTML có dạng như sau:

Tài liệu điện tử
http://www.nlv.gov.vn/dlib/L6746.pdf ">
http://www.nlv.gov.vn/dlib/">
.........
Nội dung toàn văn...(thẻ này dùng cho các dữ liệu metadata được nhúng sẵn vào tài nguyên). Nội dung này sẽ được hiển thị trên trình duyệt, còn các thẻ metadata đã được biên mục ở trên sẽ không xuất hiện trong suốt phần định dạng hay hiển thị thông tin cũng như in ấn, nó chỉ có tác dụng đối với các máy chủ tìm kiếm. Các máy chủ đó sẽ đọc được các thông tin bên trong thẻ meta đó là lấy ra nội dung theo yêu cầu tìm kiếm.


3.4. Dublin Core và Marc 21: Tham khảo

Stt
Dublin Core
Marc 21
  1.  
Nhan đề
(Title)
245 00$a
  1.  
Tác giả
(Creator)
700 1#$a: Tác giả cá nhân | $eVai trò
710 2#$a: Tác giả tập thể | $eVai trò
711 2#$a: Hội nghị, hội thảo | $eVai trò
  1.  
Chủ đề
(Subject)
653 ##$a (Thuật ngữ chủ đề không kiểm soát
650 #7$a (Thuật ngữ chủ đề có kiểm soát) | $2Nguồn
  1.  
Mô tả(Description)
520 ##$a: Mô tả tóm tắt nội dung tài liệu
505 0#$a: Phụ chú nội dung được định dạng
  1.  
Nhà xuất bản(Publisher)
260 ##$b (Nhà xuất bản, phát hành, in ấn...)
700 1#$a (Tiêu đề bổ sung – Tên cá nhân) | $eNhà xuất bản
710 2#$a (Tiêu đề bổ sung – Tên tổ chức) | $eNhà xuất bản
711 2#$a (Tiêu đề bổ sung – Tên hội nghị, hội thảo) | $eNhà xuất bản
  1.  
Tác giả phụ(Contributor)
720##$a (Tiêu đề bổ sung – Tên/tên không kiểm soát): tên người, tên tổ chức | $eThông tin về trách nhiệm liên quan
700 1#$a(Tiêu đề bổ sung – Tên cá nhân) | $eThông tin trách nhiệm
710 2#$a(Tiêu đề bổ sung – Tên tổ chức) | $eThông tin trách nhiệm
711 2#$a (Tiêu đề bổ sung – Tên hội thảo, hội nghị) | $eThông tin trách nhiệm
  1.  
Ngày tháng(Date)
260 ##$g (Ngày in, ngày sản xuất)
  1.  
Loại tài liệu(Type)
655 #7(Thuật ngữ chủ đề - Thể loại/hình thức | $2Nguồn của thuật ngữ
  1.  
Mô tả vật lý(Format)
856 ##$qVị trí và kiểu truy cập
300 ##$a Mô tả vật lý
  1.  
Định danh(Identifier)
024 8#$a(Các số/mã nhận dạng chuẩn khác)
856 40$u(Định danh tài nguyên thống nhất): URI (Uniform Resource Identifier)
020 ##$a (ISBN: International Standard Book Number)
022 ##$a (ISSN: International Standard Serial Number)
  1.  
Nguồn gốc(Source)
786 0#$o (Nguồn dữ liệu/Phụ chú)
URI: 786 0#$o (Nguồn dữ liệu/Chỉ số nhận dạng khác)
  1.  
Ngôn ngữ(Language)
546 ##$a (Phụ chú ngôn ngữ)
041$4 (Mã ngôn ngữ: ISO 639-2)
  1.  
Liên kết(Relation)
787 0#$n (Quan hệ không đặc thù/ Phụ chú)
URI: 787 0#$o (Quan hệ không đặc thù/ chỉ số nhận dạng khác)
776 0#$n (Hình thức vật lý bổ sung/ Phụ chú)
776 0#$o (Hình thức vật lý bổ sung/ Chỉ số nhận dạng khác)
  1.  
Diện bao quát(Coverage)
500$a (Phụ chú chung)
522##$aKhông gian (Phụ chú diện bao quát về địa lý)
513##$bThời gian (Phụ chú dạng báo cáo và thời kỳ được nói tới)
  1.  
Bản quyền(Rights)
540 ##$a (Phụ chú điều kiện sử dụng và tái bản)
URL: 856 42$u (Địa chỉ điện tử và truy cập/Vị trí tài nguyên thống nhất) | $3Đặc tả tài liệu


3.5. Tham khảo bảng map (ánh xạ) giữa Dublin Core và UNIMARC tại http://www.ifla.org/IV/ifla64/138-161e.htm

Không có nhận xét nào:

Đăng nhận xét