10/09/2013

Xây dựng thư viện điện tử và vấn đề số hoá tài liệu ở Việt Nam

Tóm tắt: Trình bày tiếp cận xây dựng thư viện điện tử (TVĐT). Xem xét khía cnh cấu trúc, hạ tầng cơ sở kỹ thuật và phát triển kho tư liệu số hoá của TVĐT. Đề cập việc tổ chức số hoá tài liệu trong phm vi Mng lưới các tổ chức thông tin KHCN ở Việt Nam.
TP CHÍ THÔNG TIN VÀ  LIỆU Số 2/2005 ISSN 859-2929

ThS. Nguyễn Tiến Đức, Trung tâm Thông tin KHCN Quốc gia

Phát triển từ thư viện truyền thống thành TVĐT đang là xu hướng tất yếu ở tất cả các nước. để xây dựng được một TVĐT theo đúng nghĩa, cần có một số quan điểm thống nhất, có cách tiếp cận đúngvà  lựa chọn những bước đi thích hợp. Trong bài báo này, chúng tôi luận bàn điều kiện để xây dựng TVĐT ở Việt Nam.
I. Tiếp cận xây dựng Thư viện điện tử

Để xây dựng TVĐT, chúng ta cần quan tâm nhiều vấn đề mà nổi bật là 4 khía cnh chủ yếu: Cấu trúc của TVĐT; Hạ tầng cơ sở kỹ thuật; Kho tư liệu số hoá; Các vấn đề bảo quản, khai thác và bản quyền.

Dưới đây sẽ điểm qua vấn đề 1, 2 và sau đó tập trung vào vấn đề thứ 3.

Cấu trúc của Thư viện điện tử

Các  TVĐ đều  được  bố  trí  trên  “Giao  diện  web”,  trên  đó,  ngoài  những  vùng chung như: Giới thiệu về cơ quan, về hệ thống, về  thư viện; Hướng dẫn sử dụng và các công cụ trợ giúp thì phần chủ yếu là nội dung, tức là “Tài nguyên thông tin”.

Phần  thứ  nhất  của  “Tài  nguyên  thông  tin”  thông  thường  là  Danh  mục  chủ đề/Directory. Phần này được cấu trúc theo trình tự từ chung đến riêng, từ tổng quát đến chi tiết, từ ngoài vào trong theo thứ bậc, ví dụ: Mảng/vấn đ lớn; Tiếp đó là các mục/vấn đề nhỏ;  Mỗi mục này li chia nhỏ dần theo cấu trúc hình cây: Cây – cành; Cành –nhánh to; Nhánh to –nhánh nhỏ; Nhánh nhỏ –nhánh nhỏ hơn... Cùng với các phân chia này là các điểm liên kết: đảm bảo các mối quan hệ nhiều chiều giữa các nhánh cũng như giữa nhánh với các cành. Cách tổ chức như  vậy nhằm to thuận tiện  cho người dùng trong khai thác thông tin. Thông thường trong  TVĐT các xuất bản phẩm điện tử (tp chí, bản tin, kỷ yếu ...) được bố trí sắp xếp theo kiểu này và để tìm kiếm tài liệu theo chủ đề ta có thể  “Click-Nháy”o đề mục tương ứng tuần tự từ ngoài vào trong. Nếu muốn tìm/truy cập nhanh tới tài liệu cần phải có sự hỗ trợ của Máy tìm tin/Search engine thông qua các Lệnh tìm cụ thể,....

Trong TVĐT còn có phần “Tài nguyên” thứ hai - quan trọng hơn, đó là các tổ hợp CSDL, biểu hiện Danh mục các CSDL, thường được sắp xếp theo chủ đề hoặc theo vần chữ cái. Người dùng có thể tiếp cận tới các CSDnày để khai thác thông tin theo các cấp độ khác nhau: từ thư mục tới toàn văn; khai thác riêng rẽ từng CSDhay khai thác theo Nhóm CSDL,.... Mức độ khai thác đến đâu tuỳ thuộco khả năng của hệ thống và đặc biệt là sự cho phép của cơ quan chủ quản,  các lệ phí tương ứng.

Thành phần thứ 3 trong TVĐT là phần Liên kết tới các  nguồn  tài nguyên thông tin  bên ngoài. đây là thế mnh của TVĐT. Tuy nhiên, mức đ và khả năng liên kết đến đâu phụ thuộc vào sự hợp tác với các cơ quan khác và việc khai thác các tầng thông tin số hoá đó cũng có những khác biệt. Chẳng hn: có vùng/mảng thông tin được khai thác tự do, miễn phí, nhưng có những vùng/CSDphải có mật khẩu, phải trả tiền,....

Như vậy, TVĐT không chỉ có một hệ thống mà có thể gồm nhiều hệ khác nhau. Tuy nhiên, các tài nguyên thông tin, các CSDđó liên kết được với nhau trong một chế độ phục vụ thống nhất. Tức là khiđược yêu cầu, chúng xuất hiện đối với người dùng như thể  chúng  cùng  trong  một  hệ  thống.  để  tích  hợp  được  như  vậy,  chúng  ta  phải  có  các chương trình phần mềm hỗ trợ, phải áp dụng các chuẩn nhất định trong xử lý, trong quản trị, trong trao đổi dữ liệu cũng như phải có các công cụ tìm kiếm (search engine), chuyển tải, lưu trữ thông tin,....

Tóm li, cấu trúc của TVĐT thực chất là cấu trúc của một Trang Web có liên kết đến các nguồn tin số hoá, trong đó quan trọng nhất là các CSDtoàn văn, được tổ chức theo cấu trúc có khả năng đáp ứng cho việc khai thác qua chế độ mng on-line.

Vấn đề kỹ thuật, hạ tầng cơ sở và phần mềm TVĐT

Một TVĐT phải có hạ tầng cơ sở đủ mnh, đó là:

-    Mng Intranet có tốc độ kết nối nhanh với INTERNET;

-    Hệ thống máy chủ lớn thực hiện việc quản trị và các dịch vụ khác nhau: Máy chủ  Web,  Máy  chủ  FPT,  Mail,  các  Máy  chủ  lưu,  bảo  trì  dữ  liệu;  Máy  chủ Firewall, Máy chủ cho các ứng dụng khác,....

-    Hệ thống máy trm để cập nhật, khai thác thông tin;

-    Các thiết bị công nghệ chuyên dụng cho TVĐT: mã vch, quản lý và in thẻ, máy quét, máy sao CD,....

Về phần mềm: đến nay, trên thế giới có nhiều phần mềm phục vụ cho việc xây dựng và phát triển  TVĐT. Mỗi phần mềm  đều  có những ưu, nhược điểm riêng nhưng thông  thường  một  phần  mềm  khả  dĩ  phải  có  các  module  chính  của  thư  viện,  như:  Bổ sung; Biên mục; Quản lý Kho; Phục vụ bn đọc; Mục lục trực tuyến; Phân hệ lưu hành; Quản lý tài liệu điện tử; Truy hồi và trình bày thông tin; Mượn liên thư viện; Quản trị hệ thống.

Ngoài ra, để tổ chức TVĐT ta cũng cần có: Phần mềm Hệ thống: Hệ điều hành và Hệ quản trị các CSDL; Phần mềm xuất bản điện tử, xuất bản CD/ROM.

Theo ước tính, để trang bị các thiết bị nêu trên cũng như có phần mềm TVĐT và t lập  nội  dungTVĐT  ban  đầu  ta   phải  đầu  tư  khoảng 5-7  tỷ VND,  thậm  chí  một  số người cho rằng ít nhất phải đầu tư 1 triệu USD (16 tỷ VND) cho một TVĐT trung bình của một ngành/lĩnh vực.

II. To lập và phát triển Kho tư liệu số hoá- vấn đề trọng tâm trong xây dựng TVĐT

Phần quan trọng nhất trong TVĐT chính là Kho tư liệu số hoá của bản thân cơ quan thông tin/thư viện chủ quản. Có 3 cách để to lập Kho này, đó là:

-    Tự tiến hành số hoá nguồn tư liệu trên giấy của Thư viện. Tức là chuyển tài liệu hiện có sang dng số bằng phương pháp quét hay nhập li thông tin từ bàn phím... đây là hướng phải đầu tư lớn, đầu tưliên tục và tốn kém thời gian, tiền của, công sức;

-    Bổ sung/tích hợp nguồn tin điện tử thông qua việc mua, trao đổi tài liệu điện tử đang được xuất bản (bản tin, tp chí điện tử, các chế bản điện tử  trước khi in ra trên giấy). Chúng ta đều biết: hầu hết các ấn phẩm hiện nay đều vừa xuất bản trên giấy vừa tồn ti dưới dng điện tử và nếu tận dụng được nguồn này, ta sẽ tiết kiệm được nhiều công sức, thời gian;

-    Xây  dựng  các  liên  kết  (to  khả  năng  truy  cập)  đến  các  nguồn  tài  liệu  trên INTERNET, nhấtlà  nguồn của các cơ quan có cùng diện chuyên đề bao quát.

To lập và phát triển Kho tài liệu số của riêng mỗi cơ quan thông tin/thư viện là vấn đ lớn nhất trong xây dựng TVĐT. Công việc này đòi hỏi phải đầu tư lớn và liên tục. đ làm tốt công việc này, các cơ quan xây dựng TVĐT cần có cách tiếp cận hợp lý, khả thi và kinh tế. Cụ thể là:

1. Nhất thiết phải lập kế hoch sát sao và ưu tiên đầu tư cho việc thu thập, xử lý và số hoá nguồn tin cơ bản, nguồn tin tiềm năng của riêng mình. Coi đây là nhiệm vụ trọng tâm, thậm chí phải triển khai mnh trước khi bắt tay vào xây dựng TVĐT.

Nếu không có sự đi trước này, khi ta xây dựng xong hạ tầng mng và có các phần mềm Hệ thống, phần mềm TVĐT đầy đủ  nhưng đến lúc đó cơ quan vẫn không có hoặc có rất ít tài liệu số hoá của bản thân chắc chắn TVĐT đó không thể phát huy được hiệu quả;  và như vậy, không tương xứng với kinh phí đầu tư nhiều tỷ đồng của Nhà nước.

Trong việc lựa chọn tài liệu để số hoá, ta phải ưu tiên các tài liệu đặc thù của thư viện, các tài liệu duy nhất và có giá trị lâu dài để trao đổi, ví dụ: các tài liệu quý hiếm, các sưu tập có giá trị, không ở đâu có...; ưu tiên số hoá trước hết đối với tài liệu chưa ở đâu số hoá, tài liệu tiếng hiếm, tiếng Việt,.... Song song với việc số hoá là việc xây dựng các Siêu dữ liệu đối với từng tài liệu và cập nhật tài liệu đã được số hoá này vào CSDtương ứng để phục vụ kịp thời cũng như làm cơ sở cho việc xây dựng TVĐT sau này.

Ngoài ra, ta cũng cần quan tâm đến chất lượng của việc số hoá tài liệu cũng như cần sao lưu đầy đủ, kịp thời các tài liệu số hoá đó để tránh rủi ro cũng như tránh phải làm đi làm li (lãng phí công sức, tiền của). điều này phụ thuộc nhiều vào công tác tổ chức, phụ thuộc vào cán bộ thực hiện cũng như thiết bị và quy trình số hoá.

2. Phải phối hợp, tận dụng sản phẩm số hoá của các cơ quan thông tin/thư viện khác, nhất là của những cơ quan có cùng diện chuyên đề bao quát. Trên cơ sở đó mới  có thể tăng nhanh “nguồn tin” của mình, tiết kiệm được thời gian, công sức và tiền của.

III.  Tổ  chức  số  hoá  tài  liệu  trong  phm  vi  quốc  gia  và  tiến  tới  Nền  Công nghiệp nội dung

Trong phm  vi  quốc  gia,   Nhà  nước  cần  có  chiến  lược đầu  tư  và  triển  khai  kế hoch tổng thể trong việc số hoá đối với các nguồn tin quan trọng, có ý nghĩa lâu dài.

Xác lập chính sách ưu tiên số hoá

Theo chúng tôi, Nhà nước ta nên có chính sách ưu tiên hỗ trợ cho việc số hoá đối với các tài liệu sau:

Về dng tài liệu:

-    Văn bản quy phm pháp luật;

-    Báo cáo kết quả các nhiệm vụ KHCN (các đề tài/đề án các cấp);

-    Tài liệu điều tra cơ bản, quy hoch, bản đồ;

-    Luận văn sau đi học;

-    Tài liệu hội nghị, hội thảo khoa học;

-    Tài liệu tiêu chuẩn, quy phm; Tài liệu sở hữu công nghiệp.

Về ngôn ngữ: ưu tiên số hoá tài liệu Hán nôm, tài liệu tiếng Việt. Hn chế số hoá tài liệu tiếng Anh.

Về lĩnh vực: ưu tiên số hoá tài liệu KHCN những ngành mũi nhọn.

Xác lập  và hình thành  một mng lưới các tổ chức số hoá tài liệu

Trong mng lưới các cơ quan thông tin, thư viện cần có sự phân công, phối hợp giữa các cơ quan trong việc số hoá tài liệu.

Nguyên tắc đầu tiên trong phân công là cơ quan nào có kho tư liệu chuyên môn hoá với số lượng tàiliệu nhiều nhất về lĩnh vực nào thì sẽ đảm nhận số hoá nguồn tư liệu về lĩnh vực đó và cơ quan này sẽđược Nhà nước hỗ trợ trong việc số hoá.

Trên cơ sở phân công như vậy, ta xác lập được một mng lưới các tổ chức số hoá tài liệu trên quy môlớn, hiện đi, bao quát hầu hết những dng tài liệu, những nguồn tin quan trọng nhất, những tài liệu có giá trị lâu dài ở tầm quốc gia. Từ đó hình thành mng trao đổi thông tin toàn quốc và to điều kiện thuận lợi cho các cơ quan TT-TV trọng điểm trong xây dựng và phát triển TVĐT của mình.

Nghiên cứu, lựa chọn và xác lập những chuẩn, những quy định chung trong việc số hoá tài liệu

Trong mng lưới các cơ quan TT-TV tiến hành số hoá cần có những chuẩn cũng như các quy định thống nhất đối với việc số hoá tài liệu. Những chuẩn này được xác định trên cơ sở nghiên cứu  áp dụng chuẩn của nước ngoài  vào điều kiện cụ thể của Việt Nam. Mỗi cơ quan tham gia  mng lưới số hoá đều phải tuân thủ nghiêm ngặt những chuẩn này sao cho các tài liệu số hoá luôn đảm bảo về mặt chất lượng cũng như về tiến độ thời gian; đồng thời chúng  được tổ chức trong các CSDcó cấu trúc tương hợp hoặc dễ dàng trong chuyển đổi. Có như vậy, các tài liệu số hoá đó mới có thể phục vụ rộng rãi trong toàn mng lưới và mang li hiệu quả cao.

Tổ chức số hoá tài liệu ở quy mô công nghiệp

Ho động  số  hoá  ở  quy  mô  lớn  được  gọi  là  “Ngành  công  nghiệp  nội  dung” (CNND). Theođịnh nghĩa khái quát người ta coi CNND bao gồm: thu thập thông tin; phân tích nội dung để phân loi,lưu trong bộ nhớ hoặc đưa lên mng máy tính; bao gói thông  tin  thành  các  CSD (trên  CD,  DVD,  ổ  chứng  – HDD,  thiết  bị  lưu  trữ  di  động (HDD-RAM), nhân sao và cung cấp/bán các CSDđó.

Nhiều người cho rằng, CNND là một nhánh của CNTT, vì nó gắn với CNTT. Sản phẩm của CNND là sản phẩm của CNTT, từ công nghiệp phần mềm, thu thập thông tin, xử  lý,  lưu  trữ  thông tin đến  cung cấp  thông tin.  CNND  không chỉ  liên quan  đến  phần cứng, phần mềm mà còn liên quan đến các lĩnh vực khác như lưu trữ, sản xuất các thiết bị lưu trữ (vật mang tin hiện đi).

Như vậy, nguyên vật liệu đầu vào của ngành CNND là thông tin và đầu ra cũng là thông tin. Nhưng thông tin đầu ra là CSDL, là thông tin có cấu trúc, có nội dung cụ thể và được bán/cung cấp  cho những đối tượng cụ thể nhằm phục vụ cho một/một số hot động KT-XH nhất định.

Tuy nhiên, để xây dựng được một nền CNND ở tầm quốc gia cần phải:

-    Có một hành lang pháp lý đủ mnh để: một mặt, to điều kiện thuận lợi cho các tổ chức, cá nhân tìm kiếm, xử lý, số hoá, bao gói, chuyển giao thông tin; mặt  khác,  bảo  vệ  thiết  thực  bản  quyền  tác  giả  đối  với  các  CSDcũng  như những thông tin mà các cá nhân, tổ chức sở hữu và tất nhiên là bảo đảm bí mật quốc gia;

-    Có sự phối hợp chặt chẽ về mặt tổ chức, liên kết, phân công phân mảng giữa các cơ quan có hotđộng số hoá tài liệu;

-    Có  lực  lượng  cán  bộ  chuyên  trách  thu  thập,  số  hoá,  bao  gói  thông  tin  (lực lượng này không phải chỉ là cán bộ thông tin, thư viện);

-    Trang bị các thiết bị hiện đi cho các cơ sở tham gia số hoá: ví dụ các máy quét  chuyên  dụng  (nhanh,  chất  lượng  cao,  quét  được  các  khổ  lớn,  màu  sắc đẹp...); các USB, các máy chủ sao lưu với dung lượng lớn (hàng nghìn GB); các máy sao CD chuyên dụng,...

Chắc chắn rằng, nếu tổ chức tốt ở Việt Nam ta, các sản phẩm số hoá này sẽ có thị trường không phải chỉ trong nước mà cả ở nước ngoài. Nền CNND sẽ hỗ trợ, cung cấp các nguồn tin số hoá cho các TVĐT và làm cho hot động thông tin KHCN sôi động, hấp dẫn hơn, cán bộ thông tin sẽ có nhiều việclàm và thu nhập khá hơn.

Kết luận

Tiến tới TVĐT là xu hướng tất yếu, là mong muốn của mỗi thư viện. Tuy nhiên, để có được một TVĐT hot động có hiệu quả, phát huy được thế mnh “thông tin đặc thù” của mình, cơ quan chủ quản cần có kế hoch sát thực, lựa chọn bước đi phù hợp. Trong xây dựng và phát triển TVĐT, việc to lập Kho tư liệu số hoá là nhiệm vụ hàng đầu. Giải quyết nhiệm vụ này đòi hỏi cơ quan chủ quản (cơ quan thông tin, thư viện) phải có chương trình thu thập, số hoá tài liệu và to lập các CSDmột cách đầyđủ, kịp thời, đặc biệt là các CSDtoàn văn với các tài liệu có giá trị lâu dài thuộc phm vi bao quát của cơ quan.

Tài liệu tham khảo
1.  What  are  digita libraries?/Donald  J.  Waters//  CLIR,  No  4,  July/August  1999. URL: http://WWW.clir.org/pubs/issues/issue04.htmlcơm văn phòng

2.  Digita libraries:  Definitions,  issues  and  challenges  /    Gary  Cleveland  //  UDT Occasionalpaper #8. URL:

3.   NII,   GII   and   12,   and   IT*2   Initiatives:   Implications   to   the   digita  Library development  in  the  US  /  Ching-Chih  Chen  (edited).  IT  and  globa digita Library development. Massachsets : MicroUse information, 1999, pp 49-64.

4.  European  development  in  digita libraries  /  David  Raitt  //    Ching-Chih  Chen
(edited). IT and globadigitaLibrary development. Massachsets: MicroUse information,
1999, pp  345-356.

5.  Cao Minh Kiểm. Thư viện số: định nghĩa và vấn đề.-Tp chí Thông tin & Tư liệu,
2000, số 3, tr. 5- 11.

6. Tạ Bá Hưng. Phát triển nội dung số ở Việt Nam: những nguyên tắc chỉ đo .-Tp chí Thông tin & Tưliệu, 2000, số  1, tr. 2-6.
Nguồn http://www.ted.com.vn/

Không có nhận xét nào:

Đăng nhận xét