Skoči na vsebino

Prepoznavanje podatkovnih citatov: Kaggle izziv »Make Data Count«

Prepoznavanje podatkovnih citatov: Kaggle izziv Make Data Count

Pobuda Make Data Count (MDC) je lansirala nov Kaggle izziv z naslovom Make Data Count – Finding Data References (Prepoznavanje podatkovnih citatov), katerega cilj je razvoj najsodobnejših modelov strojnega učenja za odkrivanje omemb raziskovalnih podatkov v znanstvenih člankih. S tem želi skupnost pomembno prispevati k izboljšanju prepoznavnosti in vrednotenja raziskovalnih podatkov kot samostojnega znanstvenega izida.

Cilji

Cilj izziva je razvoj modelov, ki bodo sposobni:

    • identificirati omembe raziskovalnih podatkov v znanstvenih člankih,
    • umestiti članek kot primarno omembo (podatki, ustvarjeni v okviru raziskave) ali sekundarno omembo (podatki, ki so bili ponovno uporabljeni).

Zmagovalni modeli bodo odprtokodni in javno objavljeni po zaključku tekmovanja v začetku septembra.

Vpliv

Sodelujoči modeli bodo uporabljeni za razširitev pokritosti v zbirki Data Citation Corpus, ki jo gosti MDC. Gre za odprto zbirko povezav med raziskovalnimi podatki in znanstveno literaturo, ki pa trenutno zajema le delno sliko ter pogosto ne vključuje informacij o načinu rabe podatkov. Z zmogljivimi, avtomatiziranimi orodji želijo razvijalci zagotoviti bolj kakovostne povezave med podatki in objavami.

To bo raziskovalni skupnosti omogočilo:

    • boljše razumevanje ponovne uporabe podatkov,
    • razvoj naprednejših orodij za raziskovanje,
    • izboljšano beleženje raznolikih raziskovalnih rezultatov,
    • premik k sistemskemu vrednotenju podatkov kot temeljnega znanstvenega izida.

Kdo lahko sodeluje?

Tekmovanje Prepoznavanje podatkovnih citatov je odprto do 2. septembra, sodelujejo pa lahko vsi zainteresirani raziskovalci, razvijalci in podatkovni znanstveniki. Vabljeni, da informacije o njem delite z vsemi, ki bi jih utegnilo zanimati sodelovanje. Več informacij je na voljo na spletni strani tekmovanja Kaggle: Make Data Count – Finding Data References.

 

Make Data Count je globalna, skupnostno vodena pobuda, ki si prizadeva za razvoj odprtih in standardiziranih meril za vrednotenje uporabe raziskovalnih podatkov. Z obsežnimi infrastrukturnimi in zagovorniškimi projekti že več kot desetletje spodbuja priznavanje raziskovalnih podatkov kot primarnega izida.

 

Accessibility