Chuyển đổi số và mở dữ liệu lưu trữ: Những bước đi đầu tiên
Nỗ lực đến gần hơn với công chúng
Mới chỉ cách đây vài năm, khi nghĩ về các trung tâm lưu trữ tư liệu, có lẽ trong hình dung của nhiều người vẫn hiện lên hình ảnh của những trung tâm trầm lắng với các tư liệu khô khan, xa rời công chúng và cũng không nhiều nhà nghiên cứu lui tới. Không chỉ công chúng cảm thấy điều này mà chính những người làm công tác lưu trữ cũng nhìn thấy thực trạng ấy, như chia sẻ của ông Đặng Thanh Tùng - Cục trưởng Cục Văn thư và Lưu trữ nhà nước tại tọa đàm “Chuyển đổi số trong Lưu trữ: Không còn khoảng cách” do Trung tâm Lưu trữ quốc gia I tổ chức vào ngày 19/11 vừa qua.
Thậm chí, không chỉ với công chúng mà ngay cả với các nhà nghiên cứu, việc tiếp cận tư liệu lưu trữ cũng không dễ dàng. “Đã có một thời chúng tôi gọi lưu trữ là ‘nấm mồ tư liệu’, bởi vì nó quý thật, chứa đựng nhiều thông tin thật đấy nhưng không ai tiếp cận được cả”, nhà nghiên cứu lịch sử Dương Trung Quốc nói. Ông nhớ lại một kỷ niệm khi tham gia một chuyến đi sang Nga để khai thác các tư liệu lịch sử mới, nhưng đến khi mang về thì những tư liệu đó lại bị “đóng kín lại, thậm chí gói chặt, dán tem, không cho ai tiếp cận cả”. Kết quả là sau đó, một đơn vị khác cũng cần tư liệu tương tự lại phải lặn lội sang Nga một lần nữa để tìm được tài liệu, trong khi những gì đã có lại cất kín trong kho.
Bởi cách thức tự khép mình trong nhiều năm ấy của lĩnh vực lưu trữ, những bước chuyển mình trong khoảng ba năm trở lại đây khiến nhiều người không khỏi bất ngờ trước sự thay đổi của lĩnh vực tưởng như chỉ luôn ở “ốc đảo” của riêng mình này. Đơn cử, vào tháng 1/2020, Triển lãm “Thư pháp của các Hoàng đế nhà Nguyễn” do Trung tâm Lưu trữ quốc gia I – Cục Văn thư và Lưu trữ nhà nước tổ chức đã lần đầu tiên trưng bày mở nguồn tài liệu châu bản triều Nguyễn duy nhất tại Việt Nam của 10 vị hoàng đế nhà Nguyễn. Triển lãm mở cho công chúng tiếp cận nhiều tư liệu lưu trữ quý báu, với hình thức trình bày hiện đại, sống động, áp dụng đa dạng các phương tiện âm thanh, hình ảnh, ánh sáng - một điều mà tại thời điểm đó TS Vũ Đức Liêm (giảng viên Khoa Lịch sử, Đại học Sư phạm Hà Nội) đánh giá là “một bước đột phá trong việc ‘xã hội hóa’ tri thức lịch sử”.
Không chỉ dừng ở sự đổi mới trong cách tiếp cận trực tiếp, trung tâm này đã có một bước tiến lớn hơn nữa khi tổ chức những triển lãm 3D online để bất kỳ ai dù ngồi tại nhà, trên xe, dùng máy tính hay điện thoại cũng đều có thể xem được. Một trong những triển lãm nổi bật được thực hiện theo công nghệ mới này là triển lãm 3D “Giáo dục triều Nguyễn - vang vọng còn lại” được Trung tâm Lưu trữ quốc gia I và Trung tâm Lưu trữ quốc gia IV phối hợp với các nhóm công nghệ tổ chức vào tháng 9/2021 nhằm giới thiệu hơn 100 tài liệu đặc sắc về Giáo dục dưới triều Nguyễn (1802 – 1945), được lựa chọn từ khối châu bản và mộc bản triều Nguyễn - di sản tư liệu thế giới.
Với triển lãm này, không gian trưng bày được đồ họa sống động với những hình ảnh sắc nét, giúp người xem có thể tùy ý phóng to, thu nhỏ để xem chi tiết hình ảnh tài liệu gốc, đồng thời có nhạc và lời thuyết minh đi kèm để gia tăng trải nghiệm cho người xem. Mỗi khi muốn ghé vào một “phòng” trưng bày khác, khách tham quan chỉ cần click chuột để chuyển không gian một cách linh hoạt. Không chỉ vậy, các hình ảnh, tư liệu của triển lãm cũng có thể được truy cập lại dễ dàng trên website hay fanpage của trung tâm.
Chưa dừng lại ở đó, Trung tâm Lưu trữ Quốc gia IV cũng đang hợp tác với Đại học Công nghệ (ĐHQGHN), Viện Nghiên cứu Hán Nôm và một cơ quan của Hàn Quốc để nghiên cứu việc tái tạo lại những mộc bản đã bị mất đi thông qua việc sử dụng trí tuệ nhân tạo của máy tính hay qua những tài liệu đang lưu trữ ở phiên bản 2D.
Liên kết dữ liệu
Công cuộc số hóa tài liệu đã bắt đầu được các Trung tâm Lưu trữ quốc gia “rục rịch” triển khai từ khoảng 20 năm trở lại đây, nhưng điều gì đã thúc đẩy lĩnh vực thầm lặng này có những bước tiến như những ví dụ kể trên? Có lẽ áp lực từ dịch bệnh khiến cho người xem không thể đến trực tiếp trung tâm chỉ là một phần, mà động lực lớn hơn đến từ chính sự thay đổi về tư duy của những người làm trong ngành lưu trữ và mong muốn thực sự có thể đưa các giá trị của tài liệu đến với công chúng, như chia sẻ của ông Đặng Thanh Tùng và bà Trần Thị Mai Hương - Giám đốc Trung tâm Lưu trữ Quốc gia I.
Những cuộc triển lãm sống động được thực hiện trên nền tảng số, những tư liệu, mộc bản được thể hiện dưới dạng 3D,v.v của các đơn vị lưu trữ chắc chắn là những sản phẩm chứa đựng rất nhiều nỗ lực và tâm huyết của những người đứng phía sau nó, giúp đưa các tư liệu lịch sử đến gần hơn với công chúng, đặc biệt là những người trẻ tuổi. Song, để “không còn khoảng cách giữa lưu trữ và công chúng” như mong muốn của những người làm lưu trữ, những nỗ lực đơn lẻ này có lẽ vẫn chưa đủ bởi nó mới chỉ giải quyết được một khía cạnh nhỏ trong bài toán lớn.
Châu khuyên, châu mạt, châu sổ, châu phê trong một triển lãm. Ảnh: Mỹ Hạnh
Những cuộc giới thiệu tư liệu lưu trữ trên mới chỉ là phần nổi của tảng băng trôi trong một hệ thống lưu trữ khổng lồ hầu như vẫn còn đang “phủ bụi”. Dù hiện tại không ít tài liệu ở các trung tâm lưu trữ quốc gia đã được số hóa, tuy nhiên, nếu công chúng muốn tìm kiếm danh sách tài liệu thôi chứ chưa nói đến việc truy cập vào xem toàn văn, thì vẫn phải… đến tận nơi để tìm trên máy tính trong phòng đọc của trung tâm. “Chúng ta nói rằng làm sao để không còn khoảng cách, nhưng bây giờ ngay cả việc một người ngồi ở nhà muốn tiếp cận các thư mục của châu bản thôi cũng chưa thể thực hiện được? Nếu chúng ta muốn ‘bán’ một ‘sản phẩm’ mà không giới thiệu về ‘sản phẩm’ thì sẽ rất khó để người dùng tiếp cận”, TS. Vũ Đức Liêm nêu vấn đề.
Thêm vào đó, một yếu tố cốt lõi của việc chuyển đổi số chính là làm sao để liên kết được các dữ liệu với nhau, ông Nguyễn Thế Trung - Tổng giám đốc Công ty Cổ phần Công nghệ DTT nhận định. Có hai khía cạnh trong việc liên kết này: thứ nhất là liên kết dữ liệu của quá khứ với hiện tại (ví dụ như liên kết thông tin trong các bản đồ thời xưa với thời nay), và thứ hai là liên kết dữ liệu giữa các đơn vị lưu trữ.
Hiện nay, bốn trung tâm lưu trữ quốc gia thuộc Cục Văn thư và Lưu trữ Nhà nước vẫn chưa chia sẻ được dữ liệu với nhau, thành thử nếu một người muốn tìm tài liệu ở cả bốn trung tâm, có lẽ không còn cách nào khác là… phải đi đến từng trung tâm để tìm thông tin - một điều mà nếu không phải nhà nghiên cứu thì có lẽ sẽ không có ai di chuyển từ trung tâm lưu trữ ở Hà Nội vào trung tâm lưu trữ ở Lâm Đồng để làm điều đó.
Chia sẻ về vấn đề này, ông Đặng Thanh Tùng - Cục trưởng Cục Văn thư và Lưu trữ nhà nước cho biết, Cục đang có một dự án thiết kế một hệ thống tích hợp cơ sở dữ liệu, tài liệu lưu trữ cũng như đưa vấn đề này vào trong dự án sửa đổi Luật lưu trữ, để có thể kết nối dữ liệu của không phải chỉ bốn trung tâm lưu trữ quốc gia mà còn có thể thực hiện việc quản lý tập trung và thống nhất cơ sở dữ liệu lưu trữ toàn quốc.
Mở dữ liệu
Tuy nhiên, một vấn đề nữa lại đặt ra là, khi tài liệu đã được số hóa và đưa vào hệ thống kết nối như vậy, liệu bạn đọc có thể dễ dàng truy cập hay không? Bởi hiện nay, dù muốn thu hẹp khoảng cách, nhưng “cánh cửa” để người đọc tiếp cận các tài liệu lưu trữ vẫn chưa hề rộng mở. Ngay cả với những nhà nghiên cứu, “bây giờ khi muốn đến các cơ quan lưu trữ để nghiên cứu về châu bản chẳng hạn, các đơn vị vẫn đòi hỏi phải có thư giới thiệu, phải có hiệu trưởng đóng dấu, rồi phải chứng nhận là tìm tài liệu cho đề tài nghiên cứu đã được phê duyệt”, TS. Vũ Đức Liêm cho biết. “Vậy khi đưa dữ liệu lên online, chúng ta có còn làm những việc đó nữa hay không?”, nhà nghiên cứu Trần Hữu Phúc Tiến cũng đặt câu hỏi.
“Trên thế giới có hẳn OpenGLAM, một phong trào kêu gọi mở trong các lĩnh vực trưng bày, thư viện, lưu trữ, bảo tàng. Nếu chúng ta làm đúng theo OpenGLAM thì sẽ thu được rất nhiều lợi ích như các bảo tàng ở Thụy Điển, Đức, Mỹ… đã đạt được”, chuyên gia Lê Trung Nghĩa (Ban Tư vấn Phát triển giáo dục mở, Hiệp hội các trường đại học, cao đẳng Việt Nam) từng chia sẻ trong một bài viết về số hóa di sản trên Tia Sáng.
Một ví dụ tiêu biểu là Europeana - một nền tảng số, mở, do Europeana Foundation (Quỹ Europeana), một tổ chức phi lợi nhuận có trụ sở ở Hà Lan quản lý, đã tập hợp được hơn 57 triệu đối tượng số từ các bộ sưu tập trên trực tuyến của hơn 3.500 phòng trưng bày, thư viện, viện bảo tàng, các bộ sưu tập nghe nhìn và các kho lưu trữ từ khắp châu Âu và mở cho công chúng có thể tiếp cận.
“Đôi khi việc đưa các hiện vật có từ 1.000 năm trước và đã thuộc phạm vi công cộng trở thành một hiện vật dưới dạng kỹ thuật số do ai đó đứng ra số hóa nó nắm bản quyền có thể làm mất cơ hội tiếp cận của tất cả những người còn lại, qua đó làm giới hạn việc quảng bá các hiện vật đó ở tầm thế giới. Người ta có thể không nghĩ tới là những tư liệu, sách vở, tác phẩm nghệ thuật đang nằm trong phạm vi công cộng thì khi số hóa, phiên bản số của nó cũng phải nằm trong phạm vi công cộng”, chuyên gia Lê Trung Nghĩa phân tích.
“Khi nói đến mở dữ liệu ở Việt Nam, câu hỏi đầu tiên mà nhiều người đặt ra lúc nào cũng là dữ liệu bí mật thì thế nào?”, ông cho biết trong một cuộc trao đổi với KH&PT về dữ liệu mở. Tuy nhiên, “định nghĩa của dữ liệu mở trên thế giới đã nêu rõ luôn là dữ liệu mở không bao gồm bí mật quốc gia và các dữ liệu thông tin cá nhân”, ông nói. Bởi vậy, chuyên gia Lê Trung Nghĩa cho rằng, điều quan trọng nhất để có các dữ liệu mở, giúp công chúng có thể tiếp cận dễ dàng hơn chính là việc “phải tập trung vào làm rõ các quyền bản quyền và chuẩn hóa nội dung/dữ liệu sẽ được tập hợp trên nền tảng đó từ các cơ sở khác nhau. Các bước triển khai để xuất bản nội dung/dữ liệu lên nền tảng số, mở đó phải rõ ràng và tạo điều kiện thuận lợi để từng bên cung cấp nội dung có được lựa chọn như họ mong muốn nhưng vẫn tuân thủ việc chuẩn hóa đó. Ngoài ra, để nền tảng số mở đó phát huy tác dụng, nó cần phải được chính sách, đặc biệt là chính sách cấp phép mở, ở mức quốc gia tạo thuận lợi”.
https://khoahocphattrien.vn/