Accentuate.us, Moses ac indigenoustweets

Trydarais yn ddiweddar pan ddes ar draws erthygl oedd yn cyflwyno accentuate.us, ategyn Firefox sy’n ychwanegu acenion yn awtomatig pan fyddwch yn ysgrifennu ar y we.  Mae’n gweithio gyda 116 iaith, gan gynnwys y Gymraeg. Gan nad oes cymaint â hynny o lythrennau yn y Gymraeg sydd ag acen uwchben fydd hi ddim mor ddefnyddiol i rai sy’n ysgrifennu Cymraeg ag a fydd i rai sy’n ysgrifennu ieithoedd eraill, e.e. y Wyddeleg, lle mae llythrennau acennog lawer yn fwy cyffredin.  (Fel rhywun sy’n wael am ysgrifennu Gwyddeleg, rhagwelaf y bydd o ddefnydd i mi!).

Mae sail ystadegol cyfieithu awtomatig o ddiddordeb i mi, fel ystadegydd. (Dim bod gen i wybodaeth arbenigol am y maes, does gen i ddim o gwbl). Fel Google Translate mae accentuate.us yn dibynnu ar ddadansoddiad ystadegol o gorpws mawr o destunau sydd ar gael mewn dwy iaith. Mae dadansoddiad o’r testunau hynny’n golygu bod modd defnyddio tebygolrwydd, wedi ei seilio ar ddamcaniaeth Bayes, i gynnig cyfieithiad (yn achos Google Translate) neu ble mae angen acen (yn achos Accentuate.us). Yn Haciaith 2011 siaradodd Llio Humphreys am ei gwaith is-deitlo gyda meddalwedd Moses. Ar wefan Moses des ar draws eglurhad eithaf manwl o’r model mae’n ei ddefnyddio: http://www.statmt.org/moses/?n=Moses.Background. Welais i ddim byd penodol am sail Google Translate ond byddwn yn tybio ei fod yn defnyddio rhywbeth tebyg.

Un o’r bobl y tu ôl i Accentuate.us yw Kevin Scannell, y mae ei fanylion yma. Ef, hefyd, sydd y tu ôl i indigenoustweets ac mae wedi darparu llawer o feddalwedd yn ymwneud â’r Wyddeleg.