DOI là gì? Cấu trúc tiêu chuẩn của DOI?

Mã định danh tài liệu số DOI (Digital Object Identifier) là một chuỗi ký tự duy nhất được sử dụng để xác định một tài liệu kỹ thuật số, chẳng hạn như bài báo, sách hoặc tác phẩm nghệ thuật. Mã định danh DOI được tạo bởi Tổ chức DOI Quốc tế.
Việc đăng ký mã định danh DOI cho các bài báo, các công trình nghiên cứu sẽ giúp cải thiện khả năng tìm kiếm và truy cập tới bài báo. Do mã định danh DOI là một chuỗi ký tự duy nhất được sử dụng để xác định một tài liệu kỹ thuật số, có nghĩa là các bài báo có DOI có thể được người đọc tiềm năng tìm thấy dễ dàng hơn thông qua các công cụ tìm kiếm và cơ sở dữ liệu. Hơn nữa, khi một bài báo có mã định danh DOI, các tác giả có thể dễ dàng liên kết bài báo đến các bài báo của họ. Điều này có thể giúp đảm bảo rằng các bài báo được trích dẫn chính xác và tăng khả năng bài báo được trích dẫn lại. Cuối cùng, mã định danh DOI có thể giúp tạp chí và tác giả theo dõi và quản lý các bài báo, các công trình nghiên cứu. Cụ thể, tạp chí và tác giả có thể dễ dàng theo dõi bài báo có DOI, và quản lý các phiên bản khác nhau của các bài báo. Điều này có thể giúp đảm bảo rằng các bài báo được lưu trữ một cách phù hợp và tối ưu truy cập.
Bên cạnh đó, mã định danh DOI còn cho phép kết nối với các mã định danh khác (chẳng hạn như mã định danh nhà nghiên cứu (ví dụ: ORCID) hoặc mã định danh tổ chức nghiên cứu (ví dụ: ROR)). Do đó, có thể nói mã định danh DOI là một công cụ quan trọng cho tác giả, nhà xuất bản và tạp chí quản lý, đo lường hiệu suất và cải thiện khả năng tìm kiếm và truy cập tới bài báo khoa học, công trình nghiên cứu.
Để đăng ký mã định danh DOI, đơn vị cần liên hệ với một nhà cung cấp DOI được ủy quyền bởi Tổ chức DOI Quốc tế (IDPF) để có tài khoản tạo lập mã DOI và tải lên các siêu dữ liệu theo yêu cầu của nhà cung cấp. Một số nhà cung cấp DOI phổ biến có thể kể đến là: Crossref, DataCite, mEDRA... (tìm hiểu thêm về nội dung và phạm vi hoạt động của các nhà cung cấp được ủy quyền bởi Tổ chức DOI quốc tế). Các đơn vị này kích hoạt mã DOI, quản lý siêu dữ liệu gán với mã DOI, cung cấp đường truy cập vào dữ liệu, hỗ trợ người dùng quản lý, tìm kiếm, và truy cập một cách dễ dàng. (Tham khảo thêm hướng dẫn đăng ký DOI với đơn vị cung cấp).

Cấu trúc của mã định danh DOI:

Mã định danh số DOI là một mã số xác định sự tồn tại vĩnh viễn cho một tập tin trên Internet, tuân thủ tiêu chuẩn quốc tế ISO. Trong trường hợp địa chỉ mạng của tập tin thay đổi, người truy cập bằng DOI vẫn được đổi hướng tự động đến địa chỉ mới của tập tin. Mã định danh DOI bao gồm 3 thành phần:

DOI resolver: Bộ phân giải DOI - phân tích và chuyển đổi giữa đường link DOI và dữ liệu từ đường link gốc của bài báo
Prefix: Tiền tố DOI bao gồm 2 thành phần là chỉ báo thư mục và mã đăng ký được phân tách nhau bằng dấu chấm. Chỉ báo thư mục do DOI quy định sẽ là "10", còn mã đăng ký là một chuỗi duy nhất được gán cho người đăng ký.
Suffix: Hậu tố DOI - mã dữ liệu do đơn vị đăng ký DOI tự cấu trúc nhu cầu và nội dung tạo mã định danh DOI (đây là nội dung mà đơn vị đăng ký DOI chú trọng)
Trong 3 thành phần của DOI, chỉ có phần suffix các đơn vị đăng ký DOI cần tạo phần cuối cùng, phần hậu tố. Do yêu cầu mã định danh DOI phải là duy nhất và liên tục, nội dung trong phần hậu tố cần được tạo và quản lý một cách hợp lý, rõ ràng và duy nhất.

Một số các quy tắc chung của tất cả các cơ quan đăng ký DOI:

  • Mỗi DOI phải là duy nhất.
  • Tiền tố và hậu tố phải được phân tách nhau bởi ký tự / (dấu gạch chéo)
  • Chỉ sử dụng các ký tự được phê duyệt: Các hậu tố DOI có thể là bất kỳ chuỗi chữ và số nào bao gồm tổ hợp các ký tự được phê duyệt sau:
    • Các chữ cái trong bảng chữ cái La Mã, A-Z (không phân biệt chữ hoa hay chữ thường, tuy nhiên sử dụng chữ thường sẽ tốt hơn cho khả năng truy cập).
    • Số từ 0-9.
    • Các ký tự - . _ ; ( ) / (bằng chữ: dấu gạch nối, dấu chấm, dấu gạch dưới, dấu chấm phẩy, dấu ngoặc đơn, dấu gạch chéo)
  • Các ký tự không được phê duyệt: dấu gạch ngang em dash và en dash.

Tuy nhiên, Tổ chức DOI quốc tế khuyến nghị các đơn vị đăng ký DOI nên tiến hành tạo lập và quản lý hậu tố DOI thận trọng và áp dụng một số quy tắc sau khi tạo mã định danh DOI:

  • Nên áp dụng DOI cho tất cả các cấp độ, cho dù ở cấp độ tạp chí hay sách ( DOI cấp độ tiêu đề ), hay cấp độ tập, số báo, bài báo hoặc chương.
  • Vì mã định danh DOI sẽ xuất hiện trực tuyến và trên bản in nên hậu tố DOI tốt nhất là các chuỗi ngắn dễ hiển thị, dễ đọc và dễ gõ lại do đó hậu tố DOI không nên chứa các thông tin có thể đọc được kể cả siêu dữ liệu.
  • Không nên để các thông tin như tên (hoặc tên viết tắt của tạp chí), số trang, ngày tháng... vì những loại thông tin này có thể gây nhầm lẫn hoặc xung đột với các thông tin trong siêu dữ liệu hoặc khi tạp chí thay đổi tên viết tắt, số trang, ngày tháng....

Ví dụ về mã định danh DOI tốt nhất: 10.3390/s18020479 Mã DOI này không có thông tin rõ ràng nhưng dễ gõ lại để tìm kiếm.
Ví dụ về mã định danh DOI có vấn đề: 10.5555/2014-04-01 Mã DOI này có vấn đề ở chỗ nội dung có thể gây nhầm lẫn hoặc xung đột về các thông tin trong siêu dữ liệu.

Hướng dẫn tạo hậu tố DOI:


Đối với các tạp chí sử dụng hệ thống xuất bản điện tử thì hậu tố DOI sẽ được tạo lập tự động và dễ dàng quản lý theo các mẫu được xây dựng theo nhu cầu của tạp chí, cụ thể:

  • Tạp chí có thể sử dụng các mẫu mặc định do đơn vị cung cấp DOI, ví dụ:
    • %j.v%vi%i cho các số,
    • %j.v%vi%i.%a cho các bài báo,
    • %j.v%vi%i.%a.g%g cho các bản in.
  • Hoặc tự tạo mẫu hậu tố DOI với các biến %j cho tên viết tắt của tạp chí, %v cho số tập, %i cho số phát hành, %Y cho năm ,%a cho ID bài báo, %g cho ID bản in, %f cho ID tập tin, %p cho số trang. Ví dụ: vol%viss%ipp%p có thể tạo DOI, chẳng hạn như 10.1234/vol3iss2pp230
  • Ngoài ra, tạp chí cũng có thể tự nhập một hậu tố DOI riêng cho mỗi mục được xuất bản miễn là số DOI đó phải là duy nhất.

Tóm lại, mã định danh tài liệu số DOI (Digital Object Identifier) là một chuỗi vĩnh cửu cho một tập tài liệu trên internet. Hệ thống DOI là một quy trình đổi hướng các trang mạng nhờ sự quản lý tập trung (và mỗi mã DOI chỉ gắn với một tập tin duy nhất) nên nếu địa chỉ mạng của tập tin thay đổi, người truy cập bằng DOI vẫn được đổi hướng tự động đến địa chỉ mới. Do đó, DOI đã và đang được áp dụng rộng rãi trên toàn thế giới để nhận diện các bài báo, báo cáo, sách, kỷ yếu, luận án, luận văn, và các công trình nghiên cứu khác. Các công trình nghiên cứu có chỉ số DOI sẽ cho phép người dùng tìm kiếm, trích dẫn, kết nối và đánh giá các công trình nghiên cứu. Nó giúp cho việc tìm kiếm các dữ liệu, ấn phẩm nhanh chóng hơn. Mã định danh DOI đã trở thành một chuẩn mực của hoạt động tạp chí khoa học trên thế giới hiện nay.