Umap – casglu trydar adar Gwlad y Basg

Mae Umap yn wasanaeth sydd yn casglu trydar Basgeg a’u cyflwyno ar blatfform arall. Mae’n aggregator, neu’n gydgaslgydd o’r holl drafod sy’n digwydd yn yr iaith ar Twitter.

Mae’r gwasanaeth hefyd yn rhoi deg uchaf o’r tagiau sydd wedi cael eu defnyddio yn y 24 awr dwetha, yr wythnos dwetha a’r mis dwetha.

Mae’n defnyddio algorithm i weld pa ddefnyddwyr sy’n trydar mewn Basgeg, gweld pa tweets sydd yn yr iaith ganddyn nhw, a thynnu trends allan o’r trydar hynny. Mae hefyd yn casglu data ar y defnydd iaith, allai fod yn ddefnyddiol iawn ar gyfer ymchwil a phwy a wyr pa ddefnyddiau eraill.


Argazkiak.org | Umap in Basque, in an iPad © cc-by-sa: sustatu

Heb allu deall Basgeg, na’r byd trydar Basgeg, alla i ddim gweithio allan pa mor effeithiol ydi’r system ddarganfod ar hyn o bryd, ond yn sicr byddai cael rhywbeth sydd hyd yn oed ddim ond yn fras iawn yn ddefnyddiol, er y byddai hynny’n amharu ar ddefnyddioldeb y platfform. Byddai hefyd a’r potensial i sbarduno rhagor o drafodaeth a chreu cylch adborth (feedback loop, ‘lly).

Mae nhw’n honni i allu adnabod *pob* defnyddiwr Twitter sy’n trydar yn yr iaith Fasgeg, a’n casglu 95% o’r tweets Basgeg i gyd. Gallai hyn yn digwydd trwy broses o ffeindio y geiriau arbennig hynny sydd ar yr un pryd yn unigryw i’r iaith ac yn cael eu defnyddio’n aml, neu efallai bod system adnabod iaith fwy cymhleth.

Mae yna eisoes Umap Catalaneg, sydd yn cynnwys ychwanegiad sef gwasanaeth newyddion awtomatig. Byddai hwn yn ychwanegiad gwerthfawr i’r we Gymraeg dwi’n teimlo.

Mae rhagor o gefndir ar flog Luistxo Fernandez sydd wedi gweithio ar y wefan, ac ar wefan CodeSyntax y cwmni sydd wedi rhyddhau Umap.

Maen nhw’n frwd i rannu’r gwasanaeth rhwng ieithoedd eraill felly dwi’n siwr gwelwn ni fersiwn Gymraeg yn fuan iawn.

Gallwch chi ddilyn y datblygiadau diweddaraf ar Twitter neu Umap Central.

4 sylw

  1. Edrych ymlaen at y fersiwn Gymraeg. Mae pobol yn hoffi trending topics ond mae’r gofrestr o’r DU ar Twitter yn bron hollol amherthnasol ar hyn o bryd. Bydd widgets gyda ystadegau yn bosib mewn theori hefyd.

  2. Gyda llaw dw i wedi bod yn meddwl am rywbeth tebyg ond gyda ffrydiau llawn o’r cofrestrau Twitter yma:
    http://hedyn.net/wici/Cyfeirlyfr#Twitter

    Basai’r canlyniadau yn gynnwys pob tweet gan (bron bob) defnyddwyr Cymraeg – yn gynnwys tweets Saesneg ac ieithoedd eraill gan ddefnyddwyr Cymraeg.

    Mae gyda fi mwy o ddiddordeb yn y pynciau yn tweets uniaith Cymraeg, dw i’n meddwl. Ond mae lot o siartiau amrywiol yn bosib hefyd (geotags am lleoliadau…). Mae’r gwahaniaethau yn ddiddorol.

Mae'r sylwadau wedi cau.