top of page

AI-Ready Data: Navigating the Dynamic Frontier of Metadata and Ontologies - A Workshop Summary

  • lbschreiber
  • Jul 10, 2024
  • 3 min read

Written by Jane Greenberg, Drexel University


AI-ready data, which refers to high-quality and well-prepared data that is optimized for use in artificial intelligence (AI) applications, increasingly encompasses the inclusion of metadata and ontologies to enhance value and usability. While metadata provides essential context and information about data, ontologies offer structured semantic representation of a particular domain. These additional layers of information help data scientists, researchers, and AI systems understand, interpret, and apply appropriate algorithms and models for analysis. Metadata and ontologies enable consistent data integration, interoperability, and knowledge sharing across systems - while facilitating more knowledgeable AI applications. Additionally, these systems are proving vital for supporting the FAIR (Findable, Accessible, Interoperable, and Reusable) Principles and reproducible computational research.


Despite these capacities, approaches for developing, implementing, and sustaining metadata and ontologies within AI-ready data pipelines remain inconsistent, cumbersome, and lack sufficient support. Challenges underlie the full data lifecycle from data creation, collection, and research, to longer-term aims of data preservation, archiving, reuse and support for research reproducibility. Collective, community driven efforts are needed to address current obstacles and maximize the value and reliability of data. The AI-Ready Data: Navigating the Dynamic Frontier of Metadata and Ontologies two-day workshop was held in April at Drexel University and served as a viable step toward addressing this challenge. 


Sponsored by the Institute for Data-Driven Dynamical Research, the workshop was hosted by the Metadata Research Center at Drexel and brought together more than 50 individuals with expertise across the data lifecycle to discuss issues, share solutions, and chart a path forward for addressing key challenges in preparing AI-ready data for scientific research. Participants were from the five NSF-HDR institutes, as well as other NSF initiatives (e.g., Big Data Hubs, Open Knowledge Network, FAIR OS RCNs, Research Data Alliance), industry, federal agencies (National Institute of Standards and Technology, NIST) and two U.S. National laboratories (Oak Ridge National Laboratory, and Pacific Northwest National Laboratory. 


Workshop participants shared case studies, methods, and goals for incorporating metadata and ontologies into AI-ready data frameworks. They also gathered in a series of breakout groups to discuss AI-ready data approaches, needs, and opportunities interconnecting with metadata and ontologies. 


Christine Kirkpatrick, PI of the FAIR in ML, AI Readiness, & Reproducibility Research Coordination Network (FARR RCN), presented at the Data Management, FAIR practices, and Prepping for AI-Ready Pipelines session.

 

Some key takeaways from the overall workshop include the following:

  • Incorporating metadata and ontologies into an AI-ready data framework may prove crucial for accelerating knowledge discovery and supporting longitudinal science.

  • AI methods, including generative AI, can leverage metadata and ontologies to improve and validate AI-ready data.

  • FAIR data is a component of AI ready data, although it is important to recognize that not all FAIR data is AI-ready.

  • Use cases can guide in determining the level of AI readiness necessary for data.

  • Metadata and ontology informed AI-ready data techniques developed for domain specific data are applicable across other domains.

  • More attention needs to be given to the AI-ready data spectrum, including DevOps training, AI readiness levels, and stakeholder engagement. 

  • Training: Introducing undergraduates to metadata/data practices has the potential to have tremendous impact on prepping AI ready data and improving overall data representations long term.

  • AI-readiness levels: Progress codifying AI-readiness levels (e.g.,ESIP; iHARP work presented by Sanjay Purushotham, UMBC; and exiting machine learning schemes) can further inform work on leveraging metadata and ontological systems into AI-ready data pipelines.


On the closing date, when breakout groups presented their final reports, participants wanted to keep working on their projects - many of them staying afterwards and asking if a follow-up workshop would be soon occuring. Although no plans are set for a follow-up workshop, the conversation on Fully AI Ready Data will continue at the in-person 2024 FAIR in ML, AI Readiness & Reproducibility Workshop at the AGU Conference Center in Washington, D.C. on October 9-10, 2024.



19 Comments


dwainnervi55
Apr 06

Mình từng thử theo dõi kèo trong nhiều khung giờ khác nhau và nhận ra mỗi thời điểm lại cho một cảm nhận khác. Khi xem ty le keo vào khoảng 2–3 tiếng trước trận, mình thấy dữ liệu bắt đầu được cập nhật dày hơn, đặc biệt là những thay đổi liên quan đến đội hình và thông tin bên lề. Đây là lúc mình dễ nhận ra những điều chỉnh quan trọng mà trước đó chưa có. So với việc xem quá sớm, giai đoạn này mang lại cảm giác “thực tế” hơn. Từ đó, mình thường chọn khung giờ này để theo dõi thay vì kiểm tra rải rác cả ngày.

Like

dwainnervi55
Apr 06

Không phải nền tảng nào cũng duy trì được cơ chế hỗ trợ và kiểm soát thông tin một cách rõ ràng. Khi theo dõi tại game đổi thưởng có thể thấy nhiều hệ thống thiết lập kênh hỗ trợ hoạt động liên tục, đồng thời cập nhật các cảnh báo liên quan đến chậm rút hoặc vấn đề tài khoản. Ngoài ra, thông tin hướng dẫn và điều khoản sử dụng cũng được trình bày để người dùng dễ tra cứu khi cần. Đây là cách vận hành thường gặp ở những nền tảng có kiểm soát nội dung và phản hồi. Về lâu dài, việc minh bạch thông tin giúp hạn chế các tình huống phát sinh ngoài ý…

Like

dwainnervi55
Apr 06

Mình thường chơi game buổi tối để thư giãn, nhưng quan tâm tới việc an toàn khi giao dịch. Khi thử hit club, mình thấy nền tảng được cấp phép quốc tế PAGCOR và Isle of Man, cùng hệ thống mã hóa SSL 128-bit và 2FA. Mình thử vài giao dịch nhỏ và thấy tỷ lệ thành công rất cao, mọi thao tác đều minh bạch. Điều này giúp mình yên tâm hơn khi chơi các trò mạo hiểm. Sau vài hôm dùng thử, mình vẫn thỉnh thoảng mở app để giải trí trước khi đi ngủ, vừa an toàn vừa thoải mái.

Like

dwainnervi55
Apr 06

Khi sử dụng các nền tảng online, mình đánh giá cao việc hỗ trợ khách hàng có nhanh và hiệu quả hay không. Trong quá trình trải nghiệm, mình có thử liên hệ và nhận thấy NET88 phản hồi khá nhanh qua các kênh như chat trực tiếp. Điều này giúp giải quyết vấn đề kịp thời, không làm gián đoạn quá trình sử dụng. Ngoài ra, cách hướng dẫn cũng khá rõ ràng, không vòng vo nên dễ hiểu ngay từ lần đầu. Khi dùng lâu hơn, mình thấy việc duy trì tốc độ phản hồi ổn định giúp trải nghiệm trở nên yên tâm hơn, đặc biệt trong những lúc cần xử lý nhanh các thao tác liên quan…

Like

levanminh5543
Apr 05

Mình hay tranh thủ nghỉ trưa để chơi vài ván nên cũng thử 28BET. Lúc vào thì thấy mọi thứ khá đơn giản, không cần mò nhiều. Mình chơi casino live trước, thấy load nhanh nên cũng ok. Sau đó mình thử qua thể thao thì thấy cập nhật kèo khá nhanh. Có lần mình vào lúc mạng không ổn lắm mà vẫn chơi được. Trong lúc mình dùng thì thấy thao tác khá mượt, không bị lag nhiều. Mình cũng thấy nạp rút xử lý nhanh. Với mình thì kiểu này phù hợp để chơi nhanh, giải trí nhẹ.


Like

Join our mailing list for updates on activities and events

SDSClogo-plusname-red.jpeg
ncstate-type-2x2-red.png
ncsa-logo.png
nsf logo.jpg

This work is supported through the National Science Foundation award # 2226453.

bottom of page