Updates from Hywel Jones Toggle Comment Threads | Llwybrau Byr Bysellfwrdd

  • Hywel Jones 10:53 PM on 26 April 2013 Permalink | Ateb
    Tags:   

    Cyfle i godwyr ifanc, 1-2 Mehefin 2013 

    Mae Young Rewired State (@youngrewired) yn trefnu digwyddiad yn Nhrefynwy ar 1-2 Mehefin i godwyr ifainc. https://youngrewiredstate.org/events/gb/2013/yrs-wales

    Gallai fod yn gyfle i rai hŷn gyfrannu hefyd gan eu bod yn chwilio am fentoriaid.

     
  • Hywel Jones 7:53 PM on 28 December 2012 Permalink | Ateb
    Tags: , Euskara, Frysk, Gaeilge, Gàidhlig, , IndigenousTweets,   

    Dadansoddi cofnodion indigenoustweets.com 

    Dechreuais edrych ar gofnodion IndigenousTweets.com dros y Nadolig. Mae’r wefan yn dangos manylion am hyd at y 500 trydarwr mwyaf toreithiog mewn sawl iaith. Ar ôl edrych ar y 500 trydarwr Cymraeg es i gysylltiad â Kevin Scannell, y dyn sydd yn casglu’r data, a chael ganddo ddata tebyg ond ar gyfer y 8,274 cyfan y mae e wedi eu cofnodi. Rwy eisoes wedi trydar dolen siart bybl Google grëais:  trydarwyr Cymraeg. Mae eisiau i mi egluro beth sy ar yr echelin-y ar y chwith yn hwnnw: y gymhareb o drydariadau Cymraeg: trydariadau eraill (h.y. Saesneg bron bob tro) sy yno. Felly os yw rhywun yn trydar yn Gymraeg union hanner yr amser, ei gymhareb fydd 1. Mae pawb sy â chymhareb dros un yn trydar yn Gymraeg yn amlach nag yn Saesneg felly. (Defnyddiais raddfa log fel y gellir gweld y cyfan ar y siart.) @Niapostcyntaf sydd â’r gymhareb uchaf, gan i bob un o’i 144 trydariad fod yn Gymraeg. Mae maint y cylch yn y siart yn adlewyrchu’r nifer o drydariadau Cymraeg. @newyddcymraeg, ffrwd sy’n cyfuno ffrydiau newyddion eraill, yw’r mwyaf. Mae’r siart isod yn un ffordd o ddangos eu dosbarthiad:

    Trydariadau Cymraeg, Mawrth 2006 - 20 Rhagfyr 2012

    Trydariadau Cymraeg, Mawrth 2006 – 20 Rhagfyr 2012

    Ymgais i ffitio dosbarthiad Zipf i’r data yw’r llinell syth. Does fawr o arwyddocâd iddo ond ei bod yn amlygu fod efallai fod tua’r 5000 trydarwr mwyaf toreithiog yn cynhyrchu mwy na’u siâr o drydariadau Cymraeg – neu, mewn geiriau eraill, y gellid fod wedi disgwyl mwy o drydariadau Cymraeg gan y gweddill. Tybed?

    Troais yn ôl at ddata y 500 ac edrych ar ychydig o ieithoedd eraill. Dyma ges i:

    Trydariadau 5 iaith

    Trydariadau 5 iaith

    Dim ond 380 sydd wedi trydar yng Ngaeleg yr Alban ond mae gan yr ieithoedd eraill mwy na 500 yr un. Bydd yn ddiddorol gweld, os caf y data, sut y maen nhw’n cymharu â’r Gymraeg. Mae’r siart isod yn crynhoi data y 500 yn unig. Gwelir bod cyfran uwch o drydariadau’r Basgiaid yn dueddol o fod yn y Fasgeg, i’w chymharu â chyfran Gymraeg y trydarwyr Cymraeg.

    Dosbarthiad trydariadau 5 iaith

    Dosbarthiad trydariadau 5 iaith

     
  • Hywel Jones 12:25 AM on 25 September 2012 Permalink | Ateb
    Tags:   

    META-NET: astudiaethau o sefyllfa technoleg iaith 30 o ieithoedd Ewrop 

    Mae cyfres o adroddiadau wedi cael eu cyhoeddi gan META-NET, yn edrych ar sefyllfa 30 o ieithoedd Ewrop o ran technoleg iaith. Mae Basgeg, Catalan a Gwyddeleg yn eu plith ond dydy’r Gymraeg ddim gwaetha’r modd.
    Dyma’r canlyniadau allweddol: http://www.meta-net.eu/whitepapers/key-results-and-cross-language-comparison

    Gellir llwytho copïau o’r adroddiadau unigol llawn o: http://www.meta-net.eu/whitepapers/index_html

     
    • Hywel 12:09 AM on 4 Rhagfyr 2012 Permalink

      Mae adroddiad arall newydd gael ei gyhoeddi ganddynt: Agenda Ymchwil Strategol http://www.meta-net.eu/sra-en

    • Rhodri ap Dyfrig 11:35 AM on 4 Rhagfyr 2012 Permalink

      Diolch am bostio hwn Hywel. Gobeithio bod nhw’n trin y pwnc chydig yn gallach na’r adroddiadau cyntaf ‘na.

  • Hywel Jones 12:10 AM on 15 January 2012 Permalink | Ateb
    Tags: , ,   

    Ymchwil i’r Wyddeleg gan fyfyrwraig 16 oed 

    Mae hon yn stori wych. Myfyrwyr ifainc Cymru: drosodd i chi!

    http://www.irishtimes.com/newspaper/ireland/2012/0113/1224310195201.html

     
    • Carl Morris 2:01 AM on 15 Ionawr 2012 Permalink

      Helo Hywel. Newydd darllen dy argymelliad. Ac mae syniad yn y cofnod nesaf!

  • Hywel Jones 11:49 PM on 1 January 2012 Permalink | Ateb
    Tags: R, ScraperWiki,   

    Dadansoddi trydariadau 

    Yn ôl ym mis Ebrill 2011 dechreuais chwilio a chadw trydariadau oedd yn cynnwys y gair “Cymraeg”. Doedd gen i ddim rheswm dros wneud heblaw fy mod am ddysgu mwy am Twitter a sut y byddai modd dadansoddi trydariadau. Rwyf wedi bod yn edrych ar y cyfan a drydarwyd hyd at tua 17.00 ar 30 Rhagfyr 2011: 14,736 o drydariadau (gan gynnwys ail-drydariadau) gan 6,186 o ddefnyddwyr gwahanol. Doedd y trydariadau ddim o reidrwydd yn y Gymraeg, dim ond bod y gair ‘Cymraeg’ wedi ei gynnwys.

    Y deg defnyddiwr mwyaf toreithiog oedd (a nifer eu trydariadau yn dilyn yr enw):

    adamjones416 236
    CSyFflint 148
    fideobobdydd 144
    newyddcymraeg 126
    BJRoute66 111 (pob un yn dweud Bore Da yn Gymraeg ac mewn ieithoedd eraill)
    heddgwynfor 93
    rhysw1 93
    radicalwales 89
    UmapCym 89
    Marshallmedia 88

    Dyma siart yn dangos y dosbarthiad yn llawn:

    Dosbarthiad trydariadau yn cynnwys 'Cymraeg'

    (Dim ond enwau rhai o’r defnyddwyr sy’n cael eu dangos yn amlwg).

    Bydd y ffisegwyr yn eich plith yn adnabod y dosbarthiad fel un deddf pŵer, a ieithegwyr fel un Zipf. Dyma’r llinell ffitiais gan dybio mai dosbarthiad Zipf yw e:Dosbarthiad trydariadau gyda thrawsffurfiad log

    Pe bai’r dosbarthiad yn un Zipf yn union byddai gan y llinell raddiant o minws un.

    Gan fod hwn yn wefan i bobl sydd â diddordeb mewn technoleg, dyma ychydig o fanylion technegol. Casglais y trydariadau gan ddefnyddio sgript Python o fewn Scraperwiki. Lawrlwythiais i nhw o’r fan honno mewn ffeil sqlite a’u mewnforio gan ddefnyddio pecyn RSQLite i R. Ffitiais y llinell gan ddefnyddio pecyn R VGAM.

    Rwy’n chwarae gyda’r data o hyd.  Bydd cofnodion eraill yn dilyn! Os oes diddordeb gan rywun i glywed mwy, rwy’n bwriadu fod yn Haciaith Aberystwyth ar Ionawr 28.  Erbyn hynny rwy’n gobeithio y byddaf wedi cael cyfle i edrych i mewn ymhellach i’r rhwydwaith cymdeithasol y trydarais yn ei gylch ychydig yn ôl: http://twitter.com/#!/hywelm/status/147108547119951873

     
  • Hywel Jones 8:27 PM on 7 May 2011 Permalink | Ateb  

    Accentuate.us, Moses ac indigenoustweets 

    Trydarais yn ddiweddar pan ddes ar draws erthygl oedd yn cyflwyno accentuate.us, ategyn Firefox sy’n ychwanegu acenion yn awtomatig pan fyddwch yn ysgrifennu ar y we.  Mae’n gweithio gyda 116 iaith, gan gynnwys y Gymraeg. Gan nad oes cymaint â hynny o lythrennau yn y Gymraeg sydd ag acen uwchben fydd hi ddim mor ddefnyddiol i rai sy’n ysgrifennu Cymraeg ag a fydd i rai sy’n ysgrifennu ieithoedd eraill, e.e. y Wyddeleg, lle mae llythrennau acennog lawer yn fwy cyffredin.  (Fel rhywun sy’n wael am ysgrifennu Gwyddeleg, rhagwelaf y bydd o ddefnydd i mi!).

    Mae sail ystadegol cyfieithu awtomatig o ddiddordeb i mi, fel ystadegydd. (Dim bod gen i wybodaeth arbenigol am y maes, does gen i ddim o gwbl). Fel Google Translate mae accentuate.us yn dibynnu ar ddadansoddiad ystadegol o gorpws mawr o destunau sydd ar gael mewn dwy iaith. Mae dadansoddiad o’r testunau hynny’n golygu bod modd defnyddio tebygolrwydd, wedi ei seilio ar ddamcaniaeth Bayes, i gynnig cyfieithiad (yn achos Google Translate) neu ble mae angen acen (yn achos Accentuate.us). Yn Haciaith 2011 siaradodd Llio Humphreys am ei gwaith is-deitlo gyda meddalwedd Moses. Ar wefan Moses des ar draws eglurhad eithaf manwl o’r model mae’n ei ddefnyddio: http://www.statmt.org/moses/?n=Moses.Background. Welais i ddim byd penodol am sail Google Translate ond byddwn yn tybio ei fod yn defnyddio rhywbeth tebyg.

    Un o’r bobl y tu ôl i Accentuate.us yw Kevin Scannell, y mae ei fanylion yma. Ef, hefyd, sydd y tu ôl i indigenoustweets ac mae wedi darparu llawer o feddalwedd yn ymwneud â’r Wyddeleg.

     
  • Hywel Jones 10:53 PM on 29 September 2010 Permalink | Ateb
    Tags: ,   

    Google Refine 

    Soniais am Freebase Gridworks pan ysgrifennais am OpenTech 2010. Roedd sôn bryd hynny bod Google yn mynd i’w ail-enwi a nawr maen nhw wedi gwneud: mae Google Refine yw e nawr. Rwyf wedi bod yn ei ddefnyddio am y tro cyntaf yr wythnos hon ac, fel roeddwn wedi disgwyl, mae’n declyn defnyddiol iawn i rywun sy’n gorfod glanhau data.

    Wrth lanhau rwy’n golygu sicrhau bod y data wedi fformatio’n gyson, geiriau wedi eu sillafu’n gyson ac yn y blaen. Er y gellir glanhau data mewn taenlen trwy “Ffeindio a disodli” drosodd a throsodd, mae Gridworks yn gwneud y broses lawer yn haws. Ei brif nodwedd efallai yw ei ddefnydd o beth mae’n ei alw’n “agweddau” [facets]. Wrth edrych ar golofn a defnyddio “agwedd testun”, er enghraifft, ceir crynodeb o’r golofn ar ffurf crynodeb amlder. Efallai y bydd yn dangos bod y golofn yn cynnwys 6 rhes â “Caerdydd” a 2 res â “Cardydd”. Gydag un clic, gellir eu newid i gyd i “Caerdydd”. Dydw i ddim am fanylu’n fwy. Edrycher ar y fideos sy ar y ddolen uchod i gael syniad gwell. Yn anffodus, does fawr ddim o ddogfennaeth a dydy fideos ddim yn gallu cymryd lle dogfennaeth mewn gwirionedd. Os hoffech ddarllen mwy, mae’r ddolen ganlynol yn rhoi syniad am beth mae’n gallu ei wneud: Using Freebase Gridworks to Create Linked Data

     
    • Carl Morris 9:30 AM on 30 Medi 2010 Permalink

      Diolch, defnyddiol. (Fydd e’n iawn gyda “Gaerdydd” a threigladau?)

  • Hywel Jones 10:14 PM on 12 September 2010 Permalink | Ateb
    Tags: , , , , OpenTech   

    Cynhadledd Opentech 2010 

    Dyma ychydig o nodiadau am beth ddysgais neu welais yng nghynhadledd OpenTech 2010. Mae manylion pwy oedd yno, a rhagor, ar Lanyrd.

    Cafodd y gynhadledd ei noddi eleni gan data.gov.uk a’r sesiynau am ddata oedd yr rhai oedd o ddiddordeb pennaf i mi. Efallai i mai’r sesiwn cyntaf oedd y mwyaf diddorol o’m safbwynt i. Cawsom wybod am gefndir data.gov.uk ond yn benodol cawsom ddemo o Gridworks. (Google bia fe nawr a dywedwyd eu bod yn mynd i newid ei enw cyn bo hir). Mae Gridworks yn edrych fel teclyn a allai fod yn arbennig o ddefnyddiol i lanhau data ac mae hefyd yn gallu allforio data i fformat rdf. Mae’r cofnod blog yma yn egluro sut mae ei ddefnyddio.

    Soniaf am un sesiwn arall, un gynhwysodd gyflwyniad gan Phil Gyford am greu gwefan gan ddefnyddio API Platfform Agored y Guardian sy’n cyflwyno rhywbeth tebyg i gopi papur y Guardian: http://www.guardian.gyford.com/. Mae’n werth rhoi golwg arno.

     
    • Carl Morris 10:36 PM on 12 Medi 2010 Permalink

      Diolch Hywel. Es i i OpenTech yn 2009. Baswn i wedi blogio fe yma ond mae Hacio’r Iaith wedi bodoli am 8-9 mis yn unig! Gwnaethon nhw trafod Guardian API a Data Store hefyd llynedd. Digwyddiad gwych.

  • Hywel Jones 11:34 PM on 27 April 2010 Permalink | Ateb
    Tags: Yahoo_Pipes,   

    Yahoo Pipes: adroddiadau Estyn 

    Es i gynhadledd AGI Cymru fis Rhagfyr diwethaf. Daliodd un o’r cyflwyniadau’n arbennig fy sylw, sef yr un ar Mobile GIS Mashups gan ddyn o Oxford Archaeology. Roedd yn frwd iawn am botensial Yahoo Pipes.  Doeddwn i ddim wedi dod ar ei draws cyn hynny a phenderfynais gael golwg arno rywbryd.

    Adroddais ar f’ymdrechion i geocodio lleoliadau ysgolion meithrin yn anghynhadledd Haciaith yn Aberystwyth ym mis Ionawr ac roedd gen i ddiddordeb felly i weld beth oedd Yahoo Pipes yn gallu ei wneud.

    Es ati i ddysgu sut i greu Pipe a dwi  wedi cyhoeddi dau ohonynt yn ddiweddar. Mae’r ddau’n eich galluogi i chwilio am adroddiad gan Estyn ar ysgol ond bod un yn dod o hyd i’r adroddiad Cymraeg (os oes un) a’r llall yn dod o hyd i adroddiadau Saesneg. Os ceisiwch nhw, fe welwch nad yw’r geocodio’n ddibynadwy iawn, yn enwedig yn y fersiwn Gymraeg. Mae’n amlwg nad yw API Yahoo yn llwyddiannus iawn am adnabod cyfeiriadau Cymraeg ond dydy’r Pipe sy’n chwilio am adroddiadau Saesneg ddim yn geocodio’n dda iawn chwaith. Y broblem yw bod Estyn yn cyhoeddi’r adroddiadau fel pdfs, a’r Pipe -rwy’n tybio – yn gorfod chwilio fersiwn html y pdf am rywbeth sy’n edrych fel cyfeiriad a dydy cyfeiriadau Cymraeg ddim yn edrych fel cyfeiriadau iddo.

    Mae’r Pipe yn codi darn ar hap o’r pdf i’w rhoi ym maes y disgrifiad. Os yw’r darn yn cynnwys enw’r ysgol a rhif yr ysgol mae’r Pipe yn rho’r enw’n deitl, a’r rhif yn y disgrifiad.

    Ta beth, rhowch gynnig arnyn nhw. Os ydych yn gallu awgrymu ffordd o’u gwella byddwn yn falch o glywed.

    Pipe chwilio am adroddiad Cymraeg
    Pipe chwilio am adroddiad Saesneg

     
c
compose new post
j
next post/next comment
k
previous post/previous comment
r
reply
e
edit
o
show/hide comments
t
go to top
l
go to login
h
show/hide help
esc
cancel