Data Commons

Data Commons – bul Google tárepinen jaratılǵan ashıq kodlı platforma[1] bolıp, ashıq bilimler grafigin usınadı. Ol ekonomikalıq, ilimiy hám basqa da ulıwmaǵa ashıq maǵlıwmatlar toplamların birlesken kóriniske biriktiredi.[2] RDF, RSS hám Schema.org sıyaqlı veb standartların islep shıqqan Ramanathan V. Guha bul joybardı baslaydı,[3] házirgi waqıtta onı Prem Ramaswami basqarıp atır.

Data Commons veb-saytı 2018-jıldıń may ayında, Dúnya júzilik faktlerdi tekseriw tarmaǵınıń bir qatar faktlerdi tekseriwshileri tárepinen Schema.org «ClaimReview» formatında járiyalanǵan dáslepki maǵlıwmatlar toplamı menen iske túsirildi.[4][5] Google Birlesken Milletler Shólkemi (BMSH) sıyaqlı sherikler menen birgelikte repozitoriydi toltırıw ushın jumıs isledi. Oǵan AQSH xalıq sanaǵı, Dúnya júzilik bank, AQSH miynet statistikası byurosı,[6] Wikipedia, Milliy okean hám atmosferalıq basqarması hám Federallıq tergew byurosınıń maǵlıwmatları da kiredi.[7]

Bul xızmet 2019-jılı keńeyip, tiykarınan statistikalıq ashıq maǵlıwmatlar toplamlarınan toltırılǵan RDF úlgisindegi bilimler grafigin qamtıp aldı. Xızmet 2019-jılı keńirek auditoriyaǵa járiyalandı.[8] 2020-jılı xızmet AQSHtan tısqarı maǵlıwmatlar toplamların qamtıwdı jaqsıladı, sonıń menen birge bioinformatika hám koronavirus boyınsha qamtıwın arttırdı. 2023-jılı xızmet úlken til modeline tiykarlanǵan tábiyiy tildegi interfeys penen qayta iske tústi. Sonday-aq, ol turaqlı rawajlanıw maqsetleriniń maǵlıwmatları menen BMSH maǵlıwmatlar portalınıń artqı bólegi sıpatında iske tústi.

Ózgeshelikleri

Data Commons baylanıslı maǵlıwmatlar hám bilimler grafigi baslamaları ushın ádettegige qaraǵanda statistikalıq maǵlıwmatlarǵa kóbirek itibar qaratadı. Ol geografiyalıq, demografiyalıq, háwa-rayı hám kóshpes múlk maǵlıwmatların basqa kategoriyalar menen birge qamtıp aladı, AQSHtaǵı shtatlardı, Kongress okruglerin hám qalalardı, sonday-aq biologiyalıq úlgilerdi, elektr stanciyaların hám adam genomınıń elementlerin DNK elementleri enciklopediyası (ENCODE) joybarı arqalı súwretleydi. Ol maǵlıwmatlardı hár biriniń óziniń deregi bolatuǵın semantikalıq úshlikler sıpatında usınadı. Ol hár túrli ulıwmaǵa ashıq maǵlıwmatlar toplamlarınan alınǵan statistikalıq baqlawlardıń obektke baǵdarlanǵan integraciyasına itibar qaratadı. Ol W3C SPARQL soraw tiliniń kishi toparın qollap-quwatlasa da,[9] onıń API-leri[10] sonday-aq maǵlıwmatlar ilimi, statistika hám maǵlıwmatlardı vizualizaciyalawǵa baǵdarlanǵan qurallardı — mısalı, Pandas dataframe interfeysin — qamtıydı.

Data Commons integrativli bolıp, bul onıń hár túrli maǵlıwmatlar toplamları ushın xosting platformasın usınbaytuǵınlıǵın, al maǵlıwmatlar toplamları tárepinen usınılǵan maǵlıwmatlardıń kóp bólegin bir maǵlıwmatlar grafigine birlestiriwge urınatuǵınlıǵın ańlatadı.

Texnologiyası

Data Commons grafiklik maǵlıwmatlar modeline tiykarlanǵan. Grafikke brauzer interfeysi hám bir neshe API arqalı kiriwge boladı, hám ol maǵlıwmatlardı júklew arqalı (ádette CSV hám MCF-ǵa tiykarlanǵan shablonlar) keńeytiledi.[11] Grafikke Google Izlewde tábiyiy tildegi sorawlar arqalı kiriwge boladı.[12] datacommons.org grafigin anıqlaw ushın qollanılatuǵın maǵlıwmatlar sózligi Schema.org-qa tiykarlanǵan. Atap aytqanda, StatisticalPopulation[13] hám Observation[14] Schema.org terminleri datacommons-qa uqsas qollanıw jaǵdayların qollap-quwatlaw ushın Schema.org-qa usınıldı.[15]

Joybardan alınǵan programmalıq támiynat Apache 2 licenziyası astında GitHub-ta ashıq.[16]

Derekler

  1. «Custom Data Commons». Docs - Data Commons. Qaraldı: 16-iyul 2024-jıl.
  2. Fensel, Dieter; Şimşek, Umutcan; Angele, Kevin; Huaman, Elwin; Kärle, Elias; Panasiuk, Oleksandra; Toma, Ioan; Umbrich, Jürgen; Wahler, Alexander (2020), „Introduction: What Is a Knowledge Graph?“, Knowledge Graphs (Англичанша), Cham, 1–10-bet, doi:10.1007/978-3-030-37439-6_1, ISBN 978-3-030-37438-9, S2CID 213620389, qaraldı: 2020-10-16 {{citation}}: Unknown parameter |publisher= ignored (járdem)
  3. Guha. «Data Commons, now accessible on Google Search». docs.datacommons.org (15-oktyabr 2020-jıl). Qaraldı: 16-oktyabr 2020-jıl.
  4. «Fact Checks». datacommons.org (29-mart 2019-jıl). Qaraldı: 14-oktyabr 2020-jıl.
  5. Jiang, Shan; Baumgartner, Simon; Ittycheriah, Abe; Yu, Cong „Factoring Fact-Checks: Structured Information Extraction from Fact-Checking Articles“,. Proceedings of the Web Conference 2020, WWW '20 (en). Taipei Taiwan: ACM, 2020-04-20 — 1592–1603 bet. DOI:10.1145/3366423.3380231. ISBN 978-1-4503-7023-3. 
  6. Raghavan. «How AI is powering a more helpful Google» (en). Google (15-oktyabr 2020-jıl). Qaraldı: 16-oktyabr 2020-jıl.
  7. Sheth, Amit; Padhee, Swati; Gyrard, Amelie; Sheth, Amit (2019-07-01). Knowledge Graphs and Knowledge Networks: The Story in Brief. pp. 67–75. doi:10.1109/MIC.2019.2928449. 
  8. Luong. «Doing our part to share open data responsibly». The Keyword (5-mart 2019-jıl). Qaraldı: 14-oktyabr 2020-jıl.
  9. «Query the Data Commons Knowledge Graph using SPARQL». datacommons.org. Qaraldı: 14-oktyabr 2020-jıl.
  10. «Overview». datacommons.org. Qaraldı: 14-oktyabr 2020-jıl.
  11. «Contributing to Data Commons – Adding datasets». datacommons.org. Data Commons.
  12. Guha. «Data Commons, now accessible on Google Search». docs.datacommons.org (15-oktyabr 2020-jıl). Qaraldı: 16-oktyabr 2020-jıl.
  13. «StatisticalPopulation type at Schema.org». schema.org. Qaraldı: 14-oktyabr 2020-jıl.
  14. «Observation type at Schema.org». schema.org. Qaraldı: 14-oktyabr 2020-jıl.
  15. «Proposal for representing Aggregate Statistical Data». GitHub – Schema.org repository (25-iyun 2019-jıl). Qaraldı: 14-oktyabr 2020-jıl.
  16. «datacommons.org GitHub». GitHub.