[Semantic Web] Phần 3: Mô hình trừu tượng RDF

Cập nhật lần cuối: 08/04/2017 lúc 00:25:16

Thể loại: Semantic Web

Bài này đang được viết …

RDF sử dụng một mô hình trừu tượng để phân rã thông tin/kiến thức thành những mảnh con, với 1 số luật cơ bản về ngữ nghĩa cho các mảnh này. Mục tiêu là cung cấp 1 phương thức chung mà đủ đơn giản và linh hoạt để diễn giải bất kỳ sự thật (fact) nào, nhưng có cấu trúc để các ứng dụng máy tính có thể hiểu và diễn giải cấu trúc đó.

Mô hình trừu tượng gồm các thành phần chính sau:

statement (phát biểu hay mệnh đề)
các nguồn tài nguyên subject (chủ ngữ) và object (tân ngữ, bổ ngữ)
predicate (vị ngữ)

Lưu ý: các thuật ngữ trong tiếng Việt chưa có 1 chuẩn dịch thống nhất, cho nên chúng ta tạm thời chỉ lấy tên tiếng Anh để ám chỉ cho các tên thuật ngữ này.

Với các thành phần trên, chúng ta có 1 cấu trúc đồ thị của 1 phát biểu RDF như sau:

Statement (phát biểu, mệnh đề)

Mỗi mảnh kiến thức được phân ra từ mô hình RDF gọi là 1 statement, và chúng ta luật sau:

Luật 1: Kiến thức (hoặc thông tin) được diễn giải là 1 danh sách các statement; mỗi statement có dạng Subject-Predicate_Object, và thứ tự này không bao giờ được thay đổi (cố định).

Vì vậy, 1 statement RDF phải có định dạng sau:

subject predicate object

với subject và object là tên của 2 thứ bất kỳ và predicate là tên của 1 quan hệ kết nối giữa 2 thứ đó. Theo sơ đồ trên, chúng ta subject chứa trong hình oval bên trái, subject chứa trong hình oval bên phải, và predicate là tên nhãn của mũi tên chỉ từ subject sang object.

Trong phần 2, chúng ta có bảng phân tích về máy ảnh Nikon_D7000, bây giờ chúng ta có thể diễn giải thành tập các RDF statement như sau:

Nếu bạn để ý, các statement luôn có 3 thành phần subject-predicate-object, vì vậy người ta thường gọi statement là 1 bộ ba (triple). Mỗi triple hay statement thể hiện 1 sự thật đơn (single fact), một tập các statement hay triple thể hiện 1 vài mảnh thông tin/kiến thức và hình thành nên mô hình RDF.

Tài nguyên và URI
Dựa vào bảng trên, chúng ta có danh sách các statement về máy ảnh Nikon D7000. Hình dung nếu danh sách này là 1 tập tin đánh giá được tạo bởi 1 trong những người đánh giá, và tập tin này sẽ được xuất bản trên Web. Lúc này, nếu tập tin được đặt trên Web, các tên tài nguyên trong đánh giá này như tên Nikon_D7000 sẽ có vấn đề. Chi tiết hơn, hoàn toàn có khả năng những người đánh giá khác nhau có thể dùng nhiều tên để thể hiện cho cùng 1 tài nguyên, ví dụ như Nikon 7000, Nikon-D7000 bên cạnh tên Nikon_D7000. Như vậy, chỉ cần 1 sự khác biệt nhỏ có thể là vấn đề lớn cho 1 ứng dụng nào đó cố gắng thu thập các kết quả đánh giá từ những người đánh giá; và chương trình không thể biết 2 đánh giá đánh giá cùng 1 tài nguyên nếu có tên khác nhau.

Luật 2: Tên của 1 tài nguyên phải có tính toàn cầu và được nhận diện bởi Uniform Resource Identiﬁer (URI)

Chúng ta điều biết về URL (Uniform Resource Locator), và luôn dùng URL để duyệt các trang Web mà chúng ta muốn truy cập. Lý do dùng URL là vì nó thể hiện địa chỉ mạng của 1 tài nguyên Web cho trước.

Liên quan: [Semantic Web] Phần 2: Tổng quan RDF

Tuy nhiên, có 1 sự thật khó nhận biết là URL: URL thường dùng để nhận diện tài nguyên Web mà tài nguyên này có thể trực tiếp truy xuất trên Web. Ví dụ, trang Web của bài viết này là:

Địa chỉ Web này không chỉ nhận diện trang Web của bài viết này, mà còn được dùng để truy vấn từ Web. Nói cách khác, có nhiều tài nguyên có thể nhận diện trên Web, nhưng không thể trực tiếp truy xuất từ Web. Ví dụ, tôi là 1 người được nhận dạng trên Web, nhưng không thể được truy xuất thông tin trực tiếp từ Web về cá nhân tôi. Tương tự, máy ảnh Nikon D7000 được nhận diện trên Web, nhưng không thể truy xuất thông tin của nó trên Web. Vì vậy, đối với các tài nguyên này, chúng ta không thể dùng các URL đơn giản để thể hiện chúng. May mắn là, trang Web cung cấp 1 dạng nhận diện chung cho mục đích này gọi là Uniform Resource Identiﬁer (URI). Nói chung, URL có thể hiểu là 1 dạng đặc trưng của URI. Do đó, URI được tạo để nhận diện bất cứ thứ gì mà có thể truy xuất trực tiếp trên Web, và có thể tạo để thể hiện bất cứ cái gì mà không thể truy xuất trên mạng, chẳng hạn như nhân cách con người, một tòa nhà hay ngay cả 1 khái niệm trừu tượng không tồn tại ở mặt vật lý, chẳng hạn chất lượng ảnh của 1 camera cho trước.

… đang viết …

Trích dẫn bài viết

APA:
Dammio. (2016). [Semantic Web] Phần 3: Mô hình trừu tượng RDF. https://www.dammio.com/2016/10/17/semantic-web-phan-3-mo-hinh-truu-tuong-rdf.
BibTeX:
@misc{dammio, author = {Dammio}, title = {[Semantic Web] Phần 3: Mô hình trừu tượng RDF}, year = {2016}, url = {https://www.dammio.com/2016/10/17/semantic-web-phan-3-mo-hinh-truu-tuong-rdf}, urldate = {2025-12-17} }

Kết nối