DATA: corpws/rhestr fawr o eiriau Cymraeg (1,600,000 gair)

1,600,000 “gair” Cymraeg
http://borel.slu.edu/obair/cy-freq.zip
6.9MB ffeil zip
(23 MB dad-zip)

Diolch i Kevin Scannell o Indigenous Tweets am y data.

Mae’r data yn eitha brwnt, lot o swn. Mae’n dod o gropian gwefannau Cymraeg fel rhan o broject gyda Geiriadur Prifysgol Cymru. Efallai byddi di eisiau glanhau am rhai o ddefnyddiau.

Ti’n gallu gwneud beth bynnag ti eisiau gyda’r data yma. Data dan CC-BY-SA