Thuật ngữ được sử dụng để mô tả một tệp mà dữ liệu được ghi vào là gì?

Thường được gọi là dữ liệu mô tả dữ liệu khác, siêu dữ liệu là dữ liệu tham chiếu có cấu trúc giúp sắp xếp và xác định các thuộc tính của thông tin mà nó mô tả. Trong Zen và nghệ thuật bảo trì siêu dữ liệu, John W. Warren mô tả siêu dữ liệu là "cả vũ trụ và DNA. "

Meta là một tiền tố -- trong hầu hết các cách sử dụng công nghệ thông tin -- có nghĩa là "một định nghĩa hoặc mô tả cơ bản. " Siêu dữ liệu tóm tắt thông tin cơ bản về dữ liệu, giúp dễ dàng tìm kiếm, sử dụng và tái sử dụng các phiên bản dữ liệu cụ thể

Ví dụ: tác giả, ngày tạo, ngày sửa đổi và kích thước tệp là những ví dụ về siêu dữ liệu tệp tài liệu rất cơ bản. Có khả năng tìm kiếm một phần tử cụ thể (hoặc các phần tử) của siêu dữ liệu đó giúp ai đó dễ dàng tìm thấy một tài liệu cụ thể hơn nhiều.  

Ngoài các tệp tài liệu, siêu dữ liệu được sử dụng cho

  • tập tin máy tính
  • hình ảnh
  • Cơ sở dữ liệu quan hệ
  • bảng tính
  • video
  • tập tin âm thanh
  • trang web

Việc sử dụng siêu dữ liệu trên các trang web có thể rất quan trọng. Siêu dữ liệu chứa các mô tả về nội dung của trang, cũng như các từ khóa được liên kết với nội dung. Siêu dữ liệu này thường được các công cụ tìm kiếm hiển thị trong kết quả tìm kiếm, nghĩa là độ chính xác và chi tiết của nó có thể ảnh hưởng đến việc người dùng có quyết định truy cập trang web hay không. Thông tin này thường được thể hiện dưới dạng thẻ meta

Công cụ tìm kiếm đánh giá thẻ meta để giúp quyết định mức độ liên quan của trang web. Thẻ meta đã được sử dụng làm yếu tố chính để xác định vị trí trong tìm kiếm cho đến cuối những năm 1990. Sự gia tăng tối ưu hóa công cụ tìm kiếm (SEO) vào cuối những năm 1990 đã dẫn đến việc nhiều trang web nhồi nhét siêu dữ liệu của họ vào từ khóa để đánh lừa các công cụ tìm kiếm, làm cho trang web của họ có vẻ phù hợp hơn các trang web khác.

Kể từ đó, các công cụ tìm kiếm đã giảm sự phụ thuộc vào thẻ meta, mặc dù chúng vẫn được tính đến khi lập chỉ mục các trang. Nhiều công cụ tìm kiếm cũng cố gắng ngăn chặn khả năng đánh lừa hệ thống của các trang web bằng cách thường xuyên thay đổi các tiêu chí xếp hạng, trong đó Google nổi tiếng là thường xuyên thay đổi thuật toán xếp hạng của mình

Siêu dữ liệu có thể được tạo thủ công hoặc bằng cách xử lý thông tin tự động. Tạo thủ công có xu hướng chính xác hơn, cho phép người dùng nhập bất kỳ thông tin nào họ cảm thấy có liên quan hoặc sẽ giúp mô tả tệp. Tạo siêu dữ liệu tự động có thể cơ bản hơn nhiều, thường chỉ hiển thị thông tin như kích thước tệp, phần mở rộng tệp, khi tệp được tạo và ai đã tạo tệp

Trường hợp sử dụng siêu dữ liệu

Siêu dữ liệu được tạo bất cứ lúc nào tài liệu, tệp hoặc nội dung thông tin khác được sửa đổi, bao gồm cả việc xóa nó. Siêu dữ liệu chính xác có thể hữu ích trong việc kéo dài tuổi thọ của dữ liệu hiện có bằng cách giúp người dùng tìm ra những cách mới để áp dụng dữ liệu đó

Siêu dữ liệu tổ chức một đối tượng dữ liệu bằng cách sử dụng các thuật ngữ được liên kết với đối tượng cụ thể đó. Nó cũng cho phép các đối tượng không giống nhau được xác định và ghép nối với các đối tượng giống nhau để giúp tối ưu hóa việc sử dụng tài sản dữ liệu. Như đã lưu ý, các công cụ tìm kiếm và trình duyệt xác định nội dung web nào sẽ hiển thị bằng cách diễn giải các thẻ siêu dữ liệu được liên kết với tài liệu HTML

Ngôn ngữ của siêu dữ liệu được viết sao cho dễ hiểu đối với cả hệ thống máy tính và con người, mức độ tiêu chuẩn hóa góp phần vào khả năng tương tác và tích hợp tốt hơn giữa các ứng dụng và hệ thống thông tin khác nhau

Các công ty trong lĩnh vực xuất bản kỹ thuật số, kỹ thuật, dịch vụ tài chính, chăm sóc sức khỏe và sản xuất sử dụng siêu dữ liệu để thu thập thông tin chuyên sâu về cách cải thiện sản phẩm hoặc nâng cấp quy trình. Ví dụ: các nhà cung cấp nội dung phát trực tuyến tự động hóa việc quản lý siêu dữ liệu sở hữu trí tuệ để siêu dữ liệu đó có thể được lưu trữ trên một loạt ứng dụng, do đó bảo vệ chủ sở hữu bản quyền đồng thời giúp người dùng được xác thực có thể truy cập nhạc và video

Sự trưởng thành của công nghệ AI phần nào giảm bớt gánh nặng quản lý siêu dữ liệu truyền thống bằng cách tự động hóa các quy trình thủ công trước đây để lập danh mục và gắn thẻ tài sản thông tin

Lịch sử và nguồn gốc của siêu dữ liệu

jack e. Myers, người sáng lập Metadata Information Partners (nay là The Metadata Co. ), tuyên bố đã đặt ra thuật ngữ này vào năm 1969. Myers đã đăng ký nhãn hiệu cho từ "siêu dữ liệu" không gạch nối vào năm 1986. Mặc dù vậy, các tài liệu tham khảo về thuật ngữ này xuất hiện trong các bài báo học thuật trước tuyên bố của Myers

Trong một bài báo học thuật xuất bản năm 1967, các giáo sư David Griffel và Stuart McIntosh của Viện Công nghệ Massachusetts đã mô tả siêu dữ liệu là "một bản ghi … của các bản ghi dữ liệu" xuất hiện khi dữ liệu thư mục về một chủ đề được thu thập từ các nguồn rời rạc. Các nhà nghiên cứu kết luận rằng cần có "cách tiếp cận siêu ngôn ngữ" hoặc "siêu ngôn ngữ" để cho phép hệ thống máy tính diễn giải chính xác dữ liệu này và ngữ cảnh của nó đối với các phần dữ liệu có liên quan khác. Không giống Myers, Griffel và McIntosh coi "meta" là tiền tố của "data. "

Năm 1964, một sinh viên đại học chuyên ngành khoa học máy tính tên là Philip R. Bagley bắt đầu thực hiện luận án của mình, trong đó ông lập luận rằng những nỗ lực để "tạo ra các phần tử dữ liệu tổng hợp" cuối cùng dựa trên khả năng "liên kết rõ ràng" với phần tử dữ liệu thứ hai và có liên quan, mà "chúng ta có thể gọi là 'phần tử siêu dữ liệu'. '" Mặc dù luận án của ông bị từ chối, công việc của Bagley, bao gồm cả việc ông tham khảo siêu dữ liệu, sau đó đã được xuất bản dưới dạng báo cáo theo hợp đồng với U. S. Phòng Nghiên cứu Khoa học Không quân tháng 1 năm 1969

Các loại siêu dữ liệu và ví dụ

Siêu dữ liệu được phân loại khác nhau dựa trên chức năng mà nó phục vụ trong quản lý thông tin

  • Siêu dữ liệu quản trị cho phép quản trị viên áp đặt các quy tắc và hạn chế quản lý quyền truy cập dữ liệu và quyền của người dùng. Nó cũng cung cấp thông tin về bảo trì và quản lý tài nguyên dữ liệu cần thiết. Thường được sử dụng trong bối cảnh nghiên cứu đang diễn ra, siêu dữ liệu quản trị bao gồm các chi tiết như ngày tạo, kích thước và loại tệp cũng như yêu cầu lưu trữ
  • Siêu dữ liệu mô tả xác định các đặc điểm cụ thể của một phần dữ liệu, chẳng hạn như dữ liệu thư mục, từ khóa, tên bài hát, số tập, v.v.
  • Siêu dữ liệu pháp lý cung cấp thông tin về cấp phép sáng tạo, chẳng hạn như bản quyền, cấp phép và tiền bản quyền
  • Siêu dữ liệu lưu trữ hướng dẫn vị trí của một mục dữ liệu trong một khung hoặc trình tự phân cấp
  • Siêu dữ liệu quy trình phác thảo các quy trình được sử dụng để thu thập và xử lý dữ liệu thống kê. Siêu dữ liệu thống kê là một thuật ngữ khác cho siêu dữ liệu quy trình
  • Siêu dữ liệu nguồn gốc, còn được gọi là dòng dữ liệu, theo dõi lịch sử của một phần dữ liệu khi nó di chuyển trong một tổ chức. Tài liệu gốc được ghép nối với siêu dữ liệu để đảm bảo rằng dữ liệu hợp lệ hoặc để sửa lỗi về chất lượng dữ liệu. Kiểm tra nguồn gốc là một thông lệ trong quản trị dữ liệu
  • Siêu dữ liệu tham chiếu liên quan đến thông tin mô tả chất lượng của nội dung thống kê
  • Siêu dữ liệu thống kê mô tả dữ liệu cho phép người dùng giải thích và sử dụng đúng số liệu thống kê được tìm thấy trong các báo cáo, khảo sát và bản tóm tắt
  • Siêu dữ liệu cấu trúc tiết lộ cách các phần tử khác nhau của một đối tượng dữ liệu phức hợp được lắp ráp. Siêu dữ liệu cấu trúc thường được sử dụng trong nội dung phương tiện kỹ thuật số, chẳng hạn như mô tả cách sắp xếp các trang trong sách nói để tạo thành một chương và cách sắp xếp các chương để tạo thành tập, v.v. Thuật ngữ "siêu dữ liệu kỹ thuật" là một từ đồng nghĩa được liên kết chặt chẽ nhất với các mục trong thư viện số
  • Siêu dữ liệu sử dụng là dữ liệu được sắp xếp và phân tích mỗi khi người dùng truy cập vào nó. Dựa trên phân tích siêu dữ liệu sử dụng, doanh nghiệp có thể chọn ra các xu hướng trong hành vi của khách hàng và dễ dàng điều chỉnh các sản phẩm và dịch vụ của họ để đáp ứng nhu cầu của họ
Thuật ngữ được sử dụng để mô tả một tệp mà dữ liệu được ghi vào là gì?

Cách sử dụng siêu dữ liệu hiệu quả

Tốc độ tăng trưởng dữ liệu tăng nhanh đã thúc đẩy sự quan tâm mới đến giá trị kinh doanh tiềm năng có thể được lấy từ siêu dữ liệu. Một loạt các cấu trúc dữ liệu tồn tại mang lại cả cơ hội cũng như thách thức

Quản lý siêu dữ liệu cung cấp một khung tổ chức để hài hòa các tập dữ liệu rời rạc được lưu trữ trên nhiều hệ thống khác nhau. Nó cũng cung cấp sự đồng thuận của tổ chức để mô tả thông tin, thường được chia thành dữ liệu kinh doanh, vận hành và kỹ thuật

Các công ty triển khai quản lý siêu dữ liệu để sàng lọc dữ liệu cũ hơn và phát triển cơ chế phân loại để phân loại dữ liệu theo giá trị kinh doanh của nó. Một thành phần của điều này là một danh mục hoặc cơ sở dữ liệu trung tâm đóng vai trò là kho lưu trữ siêu dữ liệu, còn được gọi là từ điển dữ liệu

Ngoài việc phân loại dữ liệu, các chiến lược quản lý siêu dữ liệu được sử dụng để cải thiện phân tích dữ liệu, phát triển chính sách quản trị dữ liệu và thiết lập một lộ trình kiểm toán để tuân thủ quy định

Về cốt lõi, quản lý siêu dữ liệu là cho phép mọi người xác định các thuộc tính của một phần dữ liệu cụ thể bằng giao diện người dùng dựa trên web. Thuộc tính có thể là tên tệp, tác giả của tệp, số ID khách hàng, v.v. Do đó, người yêu cầu tài liệu có thể xem và hiểu các thuộc tính khác nhau của dữ liệu, hệ thống doanh nghiệp chứa dữ liệu đó và lý do các thuộc tính đó được tạo

Kể từ tháng 11 năm 2020, Alation, ASG, Alex Solutions, Collibra, Erwin, IBM, Informatica, Oracle, SAP và SmartLogic được công ty phân tích CNTT Gartner xếp hạng trong số các nhà cung cấp nền tảng quản lý siêu dữ liệu hàng đầu trong Magic Quadrant cho Giải pháp quản lý siêu dữ liệu

Chuẩn hóa siêu dữ liệu

Một số tiêu chuẩn ngành đã được phát triển để làm cho siêu dữ liệu trở nên hữu ích hơn. Các tiêu chuẩn này đảm bảo tính nhất quán về ngôn ngữ chung, định dạng, chính tả và các thuộc tính khác được sử dụng để mô tả dữ liệu. Mỗi tiêu chuẩn dựa trên một lược đồ cụ thể cung cấp cấu trúc tổng thể cho tất cả siêu dữ liệu của nó

Thuật ngữ được sử dụng để mô tả một tệp mà dữ liệu được ghi vào là gì?
Các tiêu chuẩn siêu dữ liệu đảm bảo tính đồng nhất về ngôn ngữ dùng chung, định dạng, chính tả và các khía cạnh khác được sử dụng để mô tả dữ liệu. Mỗi tiêu chuẩn dựa trên lược đồ cụ thể cung cấp cấu trúc bao quát cho tất cả siêu dữ liệu của nó

Dublin Core là một tiêu chuẩn chung được sử dụng rộng rãi ban đầu được phát triển để hỗ trợ việc lập chỉ mục các danh mục thẻ thư viện vật lý. Kể từ đó, tiêu chuẩn đã được điều chỉnh cho siêu dữ liệu kỹ thuật số dựa trên web. Dublin Core mô tả các thuộc tính của 15 phần tử dữ liệu cốt lõi. tiêu đề, tác giả, chủ đề, mô tả, nhà xuất bản, cộng tác viên, ngày, loại, định dạng, số nhận dạng, nguồn, ngôn ngữ, mối quan hệ, phạm vi bảo hiểm và quản lý quyền

Một tiêu chuẩn siêu dữ liệu thư mục tương tự là Lược đồ mô tả đối tượng siêu dữ liệu, một lược đồ dựa trên XML dành cho các thư viện, do Văn phòng phát triển tiêu chuẩn và mạng của U. S. Thư viện Quốc hội với tư cách là người kế thừa các tiêu chuẩn Danh mục có thể đọc được bằng máy được phát triển vào những năm 1960

Một tiêu chuẩn mới hơn, lược đồ. org, dựa trên sự cộng tác của phần mềm nguồn mở cung cấp một bộ sưu tập lược đồ siêu dữ liệu hướng đến dữ liệu internet có cấu trúc, email và các dạng dữ liệu kỹ thuật số khác.  

Lược đồ siêu dữ liệu dành riêng cho ngành

Một số lược đồ siêu dữ liệu tiêu chuẩn đã được phát triển để đáp ứng các yêu cầu duy nhất của các ngành nhất định và ngành dọc

Nghệ thuật và nhân văn

  • Text Encoding Initiative là một tập đoàn gồm các tổ chức phát triển các tiêu chuẩn xác định các phương pháp mã hóa để thể hiện văn bản có thể đọc được bằng máy ở dạng kỹ thuật số
  • VRA Core, do Thư viện Quốc hội Hoa Kỳ và Hiệp hội Tài nguyên Trực quan đồng phát triển, được mô tả là "tiêu chuẩn dữ liệu để mô tả các tác phẩm văn hóa trực quan cũng như các hình ảnh ghi lại chúng. "

Văn hóa và xã hội

  • Data Documentation Initiative tiêu chuẩn hóa các mô tả dữ liệu được sử dụng trong khoa học hành vi và các ngành liên quan
  • Cộng đồng ngôn ngữ lưu trữ mở, dựa trên Dublin Core, cố gắng phát triển một kho tài nguyên ngôn ngữ ảo trên toàn thế giới

khoa học

  • Darwin Core được sử dụng để chia sẻ thông tin về các mẫu vật sinh học
  • Ngôn ngữ siêu dữ liệu sinh thái là định dạng đánh dấu XML có thể đọc được để chia sẻ dữ liệu về khoa học trái đất
  • Ủy ban dữ liệu không gian địa lý liên bang phát triển các định dạng siêu dữ liệu để ghi lại dữ liệu nghiên cứu không gian địa lý

Thông tin này được cập nhật lần cuối vào tháng 7 năm 2021

Tiếp tục đọc Giới thiệu về siêu dữ liệu

  • Vai trò của siêu dữ liệu trong quản lý dữ liệu phi cấu trúc là gì?
  • Cách quản lý siêu dữ liệu tự động cải thiện thông tin chi tiết về doanh nghiệp
  • Một quy trình quản lý siêu dữ liệu mạnh giúp giảm bớt những rắc rối về dữ liệu lớn
  • Siêu dữ liệu hỗn hợp, quy trình quản lý dữ liệu tổng thể phải có đối với ứng dụng dành cho thiết bị di động
  • Kho đối tượng, siêu dữ liệu tạo hệ thống lưu trữ thông minh

Điều khoản liên quan

tài chính phi tập trung (DeFi)Tài chính phi tập trung (DeFi) là một mô hình mới nổi để tổ chức và cho phép các giao dịch, trao đổi và. Xem định nghĩa đầy đủLDAP (Giao thức truy cập thư mục nhẹ)LDAP (Giao thức truy cập thư mục nhẹ) là một giao thức phần mềm cho phép mọi người định vị dữ liệu về các tổ chức,. Xem định nghĩa đầy đủ Tiếp thị công cụ tìm kiếm (SEM) Tiếp thị công cụ tìm kiếm (SEM) là một phương pháp xúc tiến và quảng cáo để giúp nội dung của công ty xếp hạng cao hơn trong công cụ tìm kiếm. Xem định nghĩa đầy đủ

Từ trong ngày

từ điển dữ liệu

Từ điển dữ liệu là tập hợp các mô tả về đối tượng dữ liệu hoặc mục trong mô hình dữ liệu mà người lập trình và những người khác có thể tham khảo

Thuật ngữ được sử dụng để mô tả một tệp mà dữ liệu được đọc từ quizlet là gì?

Thuật ngữ " tệp đầu ra " được sử dụng để mô tả một tệp mà dữ liệu được đọc từ đó.

Điều gì xảy ra khi một phần dữ liệu được ghi vào một tệp?

Khi một phần dữ liệu được ghi vào tệp, nó được sao chép từ một biến trong RAM vào tệp . Quá trình lấy dữ liệu từ tệp được gọi là quá trình đọc dữ liệu từ tệp.

Tệp dữ liệu được gọi là gì?

Tệp dữ liệu là tệp máy tính lưu trữ dữ liệu sẽ được ứng dụng hoặc hệ thống máy tính sử dụng, bao gồm dữ liệu đầu vào và đầu ra. Một tệp dữ liệu thường không chứa các hướng dẫn hoặc mã được thực thi (nghĩa là một chương trình máy tính). Hầu hết các chương trình máy tính làm việc với các tệp dữ liệu.

Chế độ nào sẽ cho phép bạn thêm dữ liệu vào tệp?

"Nối thêm" có nghĩa là thêm một thứ gì đó vào cuối một thứ khác. Chế độ "a" cho phép bạn mở một tệp để thêm một số nội dung vào đó. Và chúng tôi muốn thêm một dòng mới vào nó, chúng tôi có thể mở nó bằng chế độ "a" (nối thêm) và sau đó, gọi phương thức write(), chuyển nội dung mà chúng tôi muốn nối thêm làm đối số.