Google Refine

Soniais am Freebase Gridworks pan ysgrifennais am OpenTech 2010. Roedd sôn bryd hynny bod Google yn mynd i’w ail-enwi a nawr maen nhw wedi gwneud: mae Google Refine yw e nawr. Rwyf wedi bod yn ei ddefnyddio am y tro cyntaf yr wythnos hon ac, fel roeddwn wedi disgwyl, mae’n declyn defnyddiol iawn i rywun sy’n gorfod glanhau data.

Wrth lanhau rwy’n golygu sicrhau bod y data wedi fformatio’n gyson, geiriau wedi eu sillafu’n gyson ac yn y blaen. Er y gellir glanhau data mewn taenlen trwy “Ffeindio a disodli” drosodd a throsodd, mae Gridworks yn gwneud y broses lawer yn haws. Ei brif nodwedd efallai yw ei ddefnydd o beth mae’n ei alw’n “agweddau” [facets]. Wrth edrych ar golofn a defnyddio “agwedd testun”, er enghraifft, ceir crynodeb o’r golofn ar ffurf crynodeb amlder. Efallai y bydd yn dangos bod y golofn yn cynnwys 6 rhes â “Caerdydd” a 2 res â “Cardydd”. Gydag un clic, gellir eu newid i gyd i “Caerdydd”. Dydw i ddim am fanylu’n fwy. Edrycher ar y fideos sy ar y ddolen uchod i gael syniad gwell. Yn anffodus, does fawr ddim o ddogfennaeth a dydy fideos ddim yn gallu cymryd lle dogfennaeth mewn gwirionedd. Os hoffech ddarllen mwy, mae’r ddolen ganlynol yn rhoi syniad am beth mae’n gallu ei wneud: Using Freebase Gridworks to Create Linked Data