Skip to content

Latest commit

 

History

History
23 lines (14 loc) · 2.07 KB

CONTRIBUTING.md

File metadata and controls

23 lines (14 loc) · 2.07 KB

Αξιολογούμε τις διάφορες πηγές που έχουν καταγραφεί ως προς:

  • την ευκολία μηχανικής προσπέλασης
  • την αναγνωσιμότητα από μηχανές
  • την μορφή αρχείου
  • την έκταση ή τον όγκο
  • το αν είναι OCR'd ή όχι (εφόσον ταιριάζει στη μορφή αρχείου)
  • το περιεχόμενο

Τις πηγές αυτές τις βρίσκουμε στα αρχεία CSV και, αν θέλουμε, προσθέτουμε και άλλες πηγές που μπορεί να γνωρίζουμε, και δεν βρίσκονται στον κατάλογο.

Οι πηγές παρατίθενται επίσης στο wiki αυτού του αποθετηρίου .

Εκεί μπορείτε να τις τροποποιείτε εφόσον έχετε προτάσεις. Διαφορετικά μπορείτε να επεξεργαστείτε το Wiki και να ζητήσετε να εντάξουμε τις αλλαγές σας.

Αναπτύσσοντας το Greek Tokenizer

Δοκιμάστε τον λεξικό κατατεμαχιστή (παράδειγμα χρήσης) και ✏️ δώστε μας ανατροφοδότηση στα Issues!

Προγράμματα Επεξεργασίας

Συμβουλευτείτε τον οδηγό για τα προγράμματα επεξεργασίας.