Quel système d'écriture non déchiffré possède le plus grand corpus de texte ?

Quel système d'écriture non déchiffré possède le plus grand corpus de texte ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Des dizaines d'anciens systèmes d'écriture sont encore indéchiffrés. Ma question est: Lequel d'entre eux a le plus grand nombre d'inscriptions connues (et pourrait donc être le plus accessible au déchiffrement futur, bien que ce soit ne pas partie de ma question) ?

Par exemple, le Disque de Phaistos, dont l'inscription est dans un système d'écriture inconnu, n'a que 241 symboles au total, et aucun autre spécimen de ce système d'écriture n'est connu.

D'autre part, au début du 19ème siècle, les hiéroglyphes cunéiformes akkadiens et égyptiens, pour chacun desquels des milliers d'inscriptions comprenant des millions de jetons étaient connus, étaient encore indéchiffrés (bien sûr, ils ont tous deux été déchiffrés depuis).


C'est une question très intéressante, et le résultat n'évolue pas seulement quand on déchiffre un texte, mais aussi quand on trouve de nouvelles inscriptions.

Ainsi, même si une seule tablette a été trouvée en dehors de la Crète avant 1973, je dirais que la réponse à votre question est linéaire A : il y a 1427 documents linéaires A avec une occurrence totale de 7362-7396 signes.

Le A linéaire est une écriture religieuse de la civilisation minoenne. On pense qu'il est à l'origine du linéaire B, la forme écrite la plus ancienne du grec écrit, utilisé jusqu'à l'arrivée de l'alphabet. La principale différence avec le linéaire B est que

  • Le linéaire A n'est pas déchiffré alors que le linéaire B l'est.
  • Si le linéaire A se prononce de la même manière que le linéaire B, il est peu probable qu'il s'agisse du grec et pourrait en fait être une langue d'origine différente (éventuellement sémitique).

Je donne cette réponse en considérant que, contrairement au maya - précédemment donné, le linéaire A est complètement non déchiffré alors que l'écriture maya est en réalité déchiffrée bien que de nombreuses inscriptions restent un mystère.

Bien sûr, vous devez garder à l'esprit que le linéaire A peut répondre à votre question uniquement parce que de nombreuses recherches ont été effectuées dans la Grèce antique (il en va de même avec l'Égypte par exemple), alors qu'il pourrait y avoir une écriture inconnue, ou une pour laquelle seules quelques tablettes ont été trouvé, pour lequel nous pourrions finalement trouver un corpus beaucoup plus important. Je sais que vous avez posé une question sur le plus grand connu corpus de texte, et je veux seulement dire que vous pourriez avoir plus de chances de déchiffrer un langage de script mystérieux en recherchant réellement plus d'inscriptions de celui-ci, qu'en étudiant le script qui a le plus grand corpus de texte.


Les écrits et inscriptions mayas sont probablement le plus grand ensemble d'écrits non déchiffrés ayant la plus grande importance historique.

Aussi, ne présumez pas allègrement que les hiéroglyphes égyptiens antiques sont bien compris. La plupart des "traductions" des hiéroglyphes, en particulier celles trouvées dans les tombes royales, sont hautement conjecturales, et nous ne pouvons pas vraiment être certains de ce qu'elles disent.


Quel système d'écriture non déchiffré possède le plus grand corpus de texte ? - Histoire

La complexité est probablement la caractéristique la plus importante des systèmes d'écriture anciens auxquels les étudiants doivent faire face. La question de la complexité est importante non seulement pour comprendre l'écriture elle-même, mais aussi pour comprendre comment les premiers systèmes d'écriture ont eu un impact sur le niveau d'alphabétisation dans une société, le statut social de ceux qui savaient écrire et, plus récemment, le déchiffrement de ces systèmes d'écriture.

L'homme se décompose, son cadavre est poussière,
Tous ses proches ont péri :
Mais un livre fait de lui un souvenir
Par la bouche du récitant.
Mieux vaut un livre qu'une maison bien construite,
Que les chapelles funéraires à l'ouest
Mieux qu'un solide manoir,
Qu'une stèle dans le temple ! dix

La flexibilité des systèmes d'écriture anciens.

La Lingua Franca des relations internationales et du commerce

Les interactions interculturelles nécessitent une communication et ont donc toujours été dépendantes dans une certaine mesure de la langue et de l'écriture. À différents moments de l'histoire, des langues individuelles ont dominé ces interactions, un fait qui a donné naissance à l'expression « lingua franca ». 18 L'écriture, en tant que médium de la langue parlée, a joué un rôle tout aussi important, quoique peut-être moins célèbre, dans l'histoire de ces interactions. Alors que la communication verbale était clairement essentielle à l'interaction interculturelle entre des personnes de classes et de niveaux d'alphabétisation différents, certaines interactions n'auraient pas pu être entreprises en toute confiance sans l'aide de l'écriture. Les marchands devaient enregistrer les détails spécifiques des transactions économiques. Les fonctionnaires gouvernementaux devaient enregistrer les divers éléments des traités dont les moines avaient besoin pour copier et préserver les textes sacrés et toutes ces actions dépendaient de l'écriture.

Le déchiffrement de l'écriture ancienne

De nombreux systèmes d'écriture qui dominaient le monde de l'ancien scribe sont tombés en désuétude bien avant les temps modernes. Les langues anciennes sont mortes et, en conséquence, les systèmes d'écriture qui avaient été développés pour les transmettre ont été abandonnés. L'un des aspects les plus intéressants de l'histoire des anciens systèmes d'écriture est la façon dont ces systèmes d'écriture perdus ont été récupérés. La clé pour comprendre cette histoire est de reconnaître le défi important que ces systèmes d'écriture posent aux futurs déchiffreurs.

Dans de nombreux cas, la disponibilité de textes bilingues ou trilingues qui fournissent au déchiffreur un texte dans plusieurs écritures et langues, certaines connues et d'autres inconnues, a été essentielle au déchiffrement des systèmes d'écriture inconnus. La pierre de Rosette est peut-être l'exemple le plus connu. Il contient une inscription louant le pharaon de treize ans Ptolémée V, et la même inscription est présentée en deux versions en égyptien (l'une en hiéroglyphes, l'autre en démotique, une forme simplifiée de l'écriture) et en grec. La dernière ligne de l'inscription grecque, et des autres inscriptions qu'il s'est avérées, se traduit comme suit : « Ce décret sera inscrit sur une stèle de pierre dure en caractères sacrés, indigènes et grecs et placé dans chacun des premier, et des temples de troisième rang à côté de l'image du roi éternel." 36 Les érudits ont rarement cette chance, mais ceux qui travaillaient sur la pierre de Rosette savaient à partir de cette ligne que la pierre promettait de percer le mystère des hiéroglyphes en raison de la relation entre les textes de l'inscription.

Conclusion

L'écriture est une évolution récente de l'histoire de l'humanité. De nombreux comportements typiquement humains tels que l'enterrement des morts, la création artistique, le contrôle et l'utilisation du feu, qui se sont tous développés à l'âge paléolithique, ont des racines beaucoup plus profondes dans l'histoire humaine. L'agriculture et un mode de vie sédentaire, bien que plus récents, peuvent encore être placés à l'âge néolithique, dont l'origine remonte à environ dix à douze mille ans. En revanche, les formes d'écriture les plus anciennes sont beaucoup plus récentes, puisqu'elles sont apparues il y a seulement cinq mille ans environ en Asie occidentale et en Égypte. Le développement de l'écriture dans d'autres parties du monde a eu lieu encore plus récemment. Ainsi l'écriture est un nouveau comportement humain, apparu très récemment en termes évolutifs.

Note biographique : David Burzillo enseigne l'histoire du monde à la Rivers School de Weston, dans le Massachusetts.

Remarques

L'auteur remercie chaleureusement ses collègues Cathy Favreau, Jennie Jacoby, Jack Jarzavek et Ben Leeming pour leurs commentaires.

1 Tout d'abord, il devrait être clair pour les élèves que la langue et l'écriture ne sont pas les mêmes et se sont développées à des moments différents de l'histoire de l'humanité. Les hiéroglyphes et l'écriture cunéiforme, dont il sera question plus loin dans l'article, sont des systèmes d'écriture utilisés pour une variété de langues, mais ne sont pas eux-mêmes des langues.

2 Bien qu'il ne soit pas possible de dire quand les humains ont commencé la communication non verbale, les groupes humains ont clairement eu besoin de cette capacité très tôt dans leur histoire afin de chasser et de survivre en groupe. La parole est un développement plus récent. Les preuves actuelles suggèrent que les humains étaient physiquement capables de parler il y a environ cinquante mille ans. L'écriture a été utilisée pour la première fois il y a environ cinq mille ans.

3 Selon les rapports du recensement américain, l'anglais est la langue parlée à la maison pour 81,5% des quelque cinquante-trois millions d'enfants d'âge scolaire dans le pays. Pour 12,8 pour cent des autres, l'espagnol est la principale langue parlée à la maison. Bureau du recensement des États-Unis, « Tableau 2. Utilisation de la langue, maîtrise de l'anglais et isolement linguistique pour la population de 5 à 17 ans par État : 2000 » Tableaux récapitulatifs sur l'utilisation de la langue et la maîtrise de l'anglais : 2000 , http://www.census.gov/population/www/cen2000/phc-t20.html (consulté le 25 novembre 2003).

4 Les linguistes définissent un phonème comme la plus petite unité de son distinctif dans une langue. Ils définissent un morphème comme la plus petite unité de parole significative, constituée d'un ou plusieurs phonèmes.

5 Alors que les chercheurs ont reconnu la difficulté d'attribuer avec confiance une valeur au niveau d'alphabétisation dans les sociétés anciennes, ils n'ont pas nécessairement considéré la complexité des systèmes d'écriture anciens, en soi, comme une limite à la mesure dans laquelle l'alphabétisation pourrait imprégner une societe. Selon Herman Vanstiphout, « De toute façon, la complexité relative du système d'écriture n'aura que peu ou rien à voir avec la diffusion de l'alphabétisation. prouve que l'alphabétisation dépend beaucoup plus des priorités politiques et sociales d'une nation que des subtilités de l'écriture" ("Memory and Literacy in Ancient Western Asia," en Civilisations du Proche-Orient ancien, vol. 4, éd. Jack M. Sasson [New York : Les fils de Charles Scribner, 1995], 2188-89). Pour la discussion sur la formation des scribes, voir le chapitre trois de C. B. F. Walker, Lire le passé : cunéiforme (Berkeley : University of California Press, 1989) chapitre un de Samuel Noah Kramer, L'histoire commence à Sumer (Garden City : Anchor Doubleday, 1959) chapitre cinq de A. Leo Oppenheim, Mésopotamie antique : portrait d'une civilisation morte (Chicago : University of Chicago Press, 1977) et le chapitre cinq de H. W. F. Saggs, Civilisation avant la Grèce et Rome (New Haven : Yale University Press, 1989).

6 Saggs raconte l'histoire du roi d'Ur III Shulgi, qui ordonna à ses scribes de lire ses cantiques aux chanteurs afin qu'ils puissent les interpréter (Civilisation avant la Grèce et Rome, 104-105). J. Nicholas Postgate conclut qu'avant l'introduction d'un alphabet, « l'alphabétisation a sûrement atteint son apogée à l'époque babylonienne... " (Mésopotamie ancienne : société et économie à l'aube de l'histoire [Londres : Routledge, 1994], 69). Barry J. Kemp a écrit que l'Egypte de l'Ancien Empire était divisée en trois classes : "les hommes alphabétisés exerçant une autorité dérivée du roi, ceux qui leur sont subordonnés (portiers, soldats, carriers, etc.) et la paysannerie illettrée" ("Ancienne Royaume, Empire du Milieu et Seconde Période Intermédiaire c. 2686-1552 av. L'Egypte ancienne : une histoire sociale, éd. Bruce G. Trigger, Barry J. Kemp, David O'Connor et Alan Lloyd [Cambridge : Cambridge University Press, 1996], 81).

7 Il faut noter que ces documents ont été rédigés par les scribes eux-mêmes, il y a donc clairement un parti pris important en eux.

8 Miriam Lichtheim, Littérature égyptienne ancienne, vol. 2 (Berkeley : University of California Press, 1976), 170.

9 Voir Kramer, L'histoire commence à Sumer, 1-16, pour du matériel sur la vision sumérienne de l'éducation et des scribes.

10 Lichtheim, Littérature égyptienne ancienne, 177. Des sources primaires supplémentaires sur les scribes égyptiens peuvent être trouvées chez James B. Pritchard, éd., Textes du Proche-Orient relatifs à l'Ancien Testament (Princeton, New Jersey : Princeton University Press, 1969), 431-34.

11 La façon dont nous donnons un sens à l'origine de l'écriture est similaire à la façon dont nous traitons des problèmes similaires concernant le développement de l'agriculture. Les preuves disponibles suggèrent que l'agriculture a été inventée indépendamment dans au moins sept des régions du monde et s'est diffusée à partir de celles-ci. Dans chacune de ces sept régions, une combinaison spécifique d'animaux et de cultures a été domestiquée. Voir Bruce Smith, L'émergence de l'agriculture (New York : Bibliothèque scientifique américaine, 1995). Voir aussi C. C. Lamberg-Karlovsky et Jeremy Sabloff, Civilisations anciennes : Proche-Orient et Méso-Amérique (Prospect Heights, Ill. : Waveland Press, 1995), 60. En ce qui concerne l'écriture, les assyriologues ont eu tendance à soutenir l'idée d'une influence mésopotamienne sur le développement de l'écriture égyptienne, étant donné l'évidence d'autres influences interculturelles qui ont précédé le développement de l'écriture en Egypte. Voir Henri Francfort, La naissance de la civilisation au Proche-Orient (New York : Doubleday Anchor, 1956), 129-32 Saggs, Civilisation avant la Grèce et Rome, 72 et Postgate, Début de la Mésopotamie, 56. Lamberg-Karlovsky et Sabloff soutiennent que « l'écriture peut avoir évolué indépendamment dans les deux domaines en raison de la convergence d'une évolution parallèle » (Civilisations anciennes, 134). Un bref résumé du débat sur la relation entre les hiéroglyphes et l'écriture cunéiforme peut être trouvé dans Trigger, Kemp, O'Connor et Lloyd, L'Egypte ancienne, 37-38.

12 Les historiens ont généralement considéré que le sumérien et l'égyptien s'étaient développés à peu près en même temps, le sumérien ayant généralement un léger avantage. Des découvertes récentes en Égypte ont amené de nombreuses personnes à revoir cela, et certains égyptologues ont suggéré que les hiérogylyphes sont antérieurs à l'écriture cunéiforme. Ces dernières années, la presse a beaucoup parlé du sujet. Voir John Noble Wilford, "La sculpture d'un roi pourrait réécrire l'histoire", New York Times, 16 avril 2002 Elizabeth J. Himelfarb, « Premier alphabet trouvé en Égypte », Archéologie, janvier/février 2000, 21 Larkin Mitchell, "Earliest Egyptian Glyphs," Archéologie, mars/avril 1999, 28-29 et Vijay Joshi, "Les anciennes tablettes montrent que les Egyptiens ont peut-être été les premiers à écrire," Boston Globe, 18 décembre 1998.

13 La famille des langues sémitiques a deux branches principales, le sémitique oriental et le sémitique occidental. L'akkadien est considéré comme faisant partie de la branche sémitique orientale de la famille, qui comprend également les dialectes akkadiens du babylonien et de l'assyrien. La branche sémitique occidentale comprend de nombreuses autres langues, dont l'hébreu et l'arabe, avec lesquelles certains étudiants peuvent être familiers.

14 John King Fairbank, Chine : une nouvelle histoire (Cambridge, Mass. : Harvard University Press, 1994), 42-43.

15 Joshua Fogel écrit à propos du coréen : « Le fait même que les Coréens, un pays culturellement avancé à bien des égards, n'aient développé leur propre alphabet (hangul) qu'au XVe siècle, bien plus d'un millénaire après avoir adopté le chinois, en dit long sur la place d'honneur de la langue écrite chinoise dans leur vie » (« Le monde sinique », en L'Asie dans l'histoire occidentale et mondiale, éd. Ainslee Embree et Carol Gluck [Armonk, N.Y. : M. E. Sharpe, 1997], 684). Fogel discute également de l'importance des idées et des institutions religieuses, culturelles et politiques qui sont entrées dans chacun de ces pays à la suite de l'adoption des caractères chinois, des liens qui ont contribué à unifier l'Asie de l'Est.

16 Edwin Reischauer a décrit ainsi la situation avant que le japonais n'entreprenne la réforme de l'écriture : « Le grand progrès culturel au Japon au cours de ces siècles est d'autant plus remarquable qu'il a été réalisé par l'intermédiaire d'un type de langue entièrement différent et d'une langue extraordinairement difficile. système d'écriture" (les Japonais [Cambridge, Mass. : Belknap Press, 1977], 47).

17 Outre les exemples cités ici, il existe d'autres exemples peut-être plus familiers disponibles, y compris l'emprunt de l'alphabet phénicien par les Grecs. De plus, l'alphabet latin a été emprunté aux Grecs, peut-être en passant par les Étrusques.

18 Le premier usage de l'expression « lingua franca », selon le Dictionnaire Oxford vieil anglais, est de John Dryden. Les autres exemples fournis proviennent des deux contextes méditerranéens.

19 Compte tenu de la récente publicité sur le film de Mel Gibson La passion du Christ, de nombreux étudiants peuvent connaître l'existence de l'araméen. Cette langue a remplacé l'akkadien en tant que lingua franca de l'Asie occidentale et a ensuite été remplacée par l'arabe.

20 Pour un bref aperçu des textes d'Amarna, voir Barbara Ross, « Correspondence in Clay », Monde Aramco, novembre/décembre 1999, 30-35.

21 Shlomo, Izre'el, « Les lettres d'Amarna de Canaan », in Sasson, Civilisations du Proche-Orient ancien., vol. 4, 2412.

22 Quatre lettres des archives Mari et vingt-huit lettres de la correspondance d'Amarna sont reproduites dans Pritchard, Textes anciens du Proche-Orient relatifs à l'Ancien Testament.

23 affaissements, Civilisation avant la Grèce et Rome, 182.

24 affaissements, Civilisation avant la Grèce et Rome, 184.

25 Ross, "Correspondance en argile," 31-32.

26 C. W. Ceram, Dieux, tombeaux et érudits : l'histoire de l'archéologie (New York : Bantam Books, 1972). Bien qu'écrit à l'origine en 1949, ce livre a été réédité et est très accessible aux élèves du secondaire. Ceram décrit en détail le déchiffrement de l'écriture cunéiforme et des hiéroglyphes.

27 Pour le linéaire B, voir John Chadwick, Le déchiffrement du linéaire B (Londres : Cambridge University Press, 1990) et Andrew Robinson, L'homme qui a déchiffré le linéaire B : l'histoire de Michael Ventris (Londres : Thames et Hudson, 2002). Pour Maya, voir Michael Coe, Briser le code Maya (Londres : Thames et Hudson, 1999) et « Un triomphe de l'esprit : comment Yuri Knorosov a craqué le code hiéroglyphique maya de la lointaine Leningrad » Archéologie, septembre/octobre 1991, 33-44 et David Roberts, « The Decipherment of Ancient Maya »,L'Atlantique, septembre 1991, 87-100.

28 Voir Andrew Robinson, Langues perdues : l'énigme des scripts non déchiffrés du monde (New York : McGraw Hill, 2002). Robinson consacre des chapitres à la réflexion actuelle sur les écritures non déchiffrées du méroïtique, du linéaire A, de l'étrusque, du proto-élamite et du rongorongo.

29 Samuel Noé Kramer, Les Sumériens : leur histoire, leur culture et leur caractère (Chicago : University of Chicago Press, 1963), 19-26.

30 Voir Michael Coe, Les Mayas (Londres : Thames et Hudson, 1999).

31 Peter Daniels, "Le déchiffrement des écritures anciennes du Proche-Orient", dans Sasson, Civilisations du Proche-Orient ancien, vol. 1, 82.

32 En référence à l'assyrien, Daniels rapporte : « L'interprétation du sumérien s'est avérée être le travail de plusieurs décennies, au cours desquelles une sérieuse controverse a éclaté quant à savoir s'il s'agissait ou non d'une langue réelle ou d'un code conçu par les prêtres assyriens pour dissimuler le mystères » (« Le déchiffrement des écritures anciennes du Proche-Orient », 86). Coe cite des attitudes similaires parmi les mayanistes du milieu du vingtième siècle, tels que Richard Long et Paul Schellhas, qui doutaient que les glyphes mayas représentent la langue (Briser le code Maya, 137-44).

33 Maurice Pape, L'histoire du déchiffrement archéologique : des hiéorglyphes égyptiens au linéaire B (New York : Les Fils de Charles Scribner, 1977), 186.

34 Voir Pape, L'histoire du déchiffrement archéologique, et Coe, Briser le code Maya.

35 Voir Coe, Briser le code Maya, 43-44, pour un bon résumé de cette question et d'autres questions générales liées au déchiffrement. Voir aussi l'introduction de Robinson à Langues perdues, esp. 40-43 et Chadwick, Le déchiffrement du linéaire B, 41-43.

36 Stephen Quirke et Carol Andrews, La pierre de Rosette : dessin en fac-similé avec introduction et traductions (Londres : British Museum Publications, 1988).

37 La transcription de Rawlinson comportait beaucoup de risques, car l'inscription a été faite sur le flanc d'une falaise rocheuse à environ 340 pieds au-dessus du sol. George Cameron de l'Université du Michigan a étudié l'inscription et en a fait des moules en latex en 1948. Son travail et de nombreuses photographies en gros plan de son étude peuvent être trouvés dans George Cameron, "Darius Carved History on Ageless Rock," National Geographic, décembre 1950, 825-44.

38 Pape, L'histoire du déchiffrement archéologique, 162. Les déchiffrements de l'ougaritique et du linéaire B n'ont pas suivi ce schéma.

39 L'identification de mots individuels dans un système d'écriture inconnu peut être une étape importante dans la traduction de la langue sous-jacente, mais elle ne garantit pas toujours que le déchiffrement suivra. Etruscan est un bon exemple de ce fait. Parce que l'alphabet étrusque est lié à l'alphabet grec, les mots étrusques peuvent être lus, y compris de nombreux noms de personnes. Mais en raison des types de textes disponibles, principalement funéraires, et de la longueur des textes disponibles, les chercheurs n'ont pas été en mesure de passer de ce niveau très basique de compréhension des mots à une compréhension de la langue dans son ensemble.

40 Pape, L'histoire du déchiffrement archéologique, 189.

41 Pope écrit à propos de cette méthode : « Mais ce qui rendait le déchiffrement linéaire B unique et captivait l'imagination du monde, c'était la grille phonétique abstraite initiée par Kober et considérablement étendue par Ventris. Son effet était de définir plus étroitement l'emploi des signes syllabiques. qu'auparavant. Au lieu de dire "signez X signifie une syllabe' il est devenu possible de dire 'signe X représente une syllabe partageant un élément avec la syllabe représentée par signe oui.' Les règles d'écriture étaient donc connues avec plus de précision, et cela compensait l'exiguïté et l'imprécision de la zone cible" (L'histoire du déchiffrement archéologique, 188).

42 Voir les sites Web suggérés à la fin de l'article pour des exemples.

43 Dans au moins un cas, celui des Mycéniens, le corpus documentaire existant est entièrement administratif. Puisque la plupart des étudiants associeront probablement Homer et son Iliade et Odyssée avec les Mycéniens, il vaudrait probablement la peine de rappeler aux étudiants que le Linéaire B n'était pas le grec d'Homère, et que les œuvres d'Homère ne sont pas des exemples de la littérature mycénienne.

44 Par exemple, Paul Halsall gère un grand nombre d'excellents sites Web contenant des documents de source primaire téléchargeables relatifs à de nombreuses périodes et thèmes historiques. L'adresse de son livre de sources d'histoire ancienne est http://www.fordham.edu/halsall old/asbook.html.

45 Voir Kramer, L'histoire commence à Sumer, 1-16.

46 Pope précise que Thomas Young était très jaloux de Champollion et que tous deux critiquaient sa méthode et s'attribuaient le mérite de ses idées (L'histoire du déchiffrement archéologique, 66-68, 84). Cette jalousie était certainement due en partie au fait que Champollion avait obtenu le mérite de la percée revendiquée par Young, elle avait donc un aspect personnel. Cela ne me surprendrait pas, cependant, à la suite des guerres napoléoniennes et de la concurrence anglo-française en Asie, si une partie de la jalousie ressentie par Young provenait du fait qu'un Français plutôt qu'un Anglais était responsable du déchiffrement.

Lecture suggérée

Ceram, C.W. Dieux, tombeaux et érudits : l'histoire de l'archéologie. New York : Bantam Books, 1972. Les sections sur le déchiffrement des hiéroglyphes et cunéiformes sont très accessibles pour les lycéens.

Chadwick, John. Le déchiffrement du linéaire B. Cambridge : Cambridge University Press, 2002. Chadwick, qui a travaillé avec Michael Ventris, a écrit ce bref compte rendu pour le grand public.

Chadwick, John. Lire le passé : le linéaire B et les scripts associés. Berkeley : University of California Press, 1997. Chaque volume de la série Reading the Past contient une étude d'environ soixante pages sur le sujet avec d'excellentes descriptions et illustrations. Voir Davies et Walker ci-dessous pour d'autres volumes de cette série.

Coe, Michael. Briser le code Maya. Londres : Tamise et Hudson, 1999. Une excellente histoire du déchiffrement de l'écriture maya.

Davies, W.V. Lire le passé : les hiéroglyphes égyptiens. Berkeley : University of California Press, 1987.

Erman, Adolf éd. Les Égyptiens antiques : un recueil de leurs écrits. New York:

Harper Torchbooks, 1966. Contient quelques sources primaires sur l'éducation dans l'Égypte du Nouvel Empire.

Friedrich, Johannes. Langues éteintes. New York : Philosophical Library, 1957. Un traitement très lisible du déchiffrement et des écritures anciennes. Ce livre était sous presse lorsque l'auteur a entendu parler des travaux de Ventris, donc une annexe sur le linéaire B a été ajoutée.

Oppenheim, A. Leo. Mésopotamie antique : portrait d'une civilisation morte. Chicago : University of Chicago Press, 1977. Contient de bonnes sections sur l'écriture et les scribes.

Pape, Maurice. L'histoire du déchiffrement : des hiéroglyphes égyptiens au linéaire B. New York : Charles Scribner's Sons, 1975. Coe appelle cela le "meilleur livre général sur le déchiffrement".

Postgate, J. Nicolas. Mésopotamie antique : société et économie à l'aube de l'histoire. Londres : Routledge, 1995. Section sur l'évolution de l'écriture en Mésopotamie.

Robinson, André. Langues perdues : l'énigme des scripts non déchiffrés du monde. New York : McGraw Hill, 2002. Robinson a écrit de nombreux livres sur l'écriture et le langage. Il a également publié une biographie de Michael Ventris en 2002.

Saggs, H.W. F. Civilisation avant la Grèce et Rome. New Haven : Yale, 1989. Chapitres sur l'écriture et l'éducation.

Sasson, Jack éd. Civilisations du Proche-Orient ancien. Tomes 1-4. New York : Charles Scribner's Sons, 1995. Le volume 1 contient une section sur le déchiffrement par Peter Daniels. Le volume 4 contient une section consacrée à la langue, à l'écriture et à la littérature, avec des contributions de Denise Schmandt-Bessarat, D.O. Edzard, John Huehnegard, Edward Wente et Laurie Pearce. De nombreux articles précieux peuvent être trouvés dans cet ouvrage de référence.

Von Soden, Wolfram. L'Orient ancien : Introduction à l'étude du Proche-Orient ancien. Grand Rapids : William B. Erdmans, 1994. Chapitre sur l'écriture et les systèmes d'écriture.

Walker, CBF. Lire le passé : cunéiforme. Berkeley : University of California Press, 1989.


Oracle Bones et l'écriture du futur sous la dynastie Shang

Comme cela a déjà été rapporté dans un article sur les origines anciennes, les os d'oracle sont un type d'artefact surtout connu pour son association avec la dynastie Shang de la Chine ancienne (1600-1046 av. Comme ces artefacts étaient utilisés à des fins de divination, les os ont été appelés « os d'oracle ». En plus de nous fournir des informations sur les croyances des habitants de la dynastie Shang, les os d'oracle sont également importants car ils forment le premier corps important connu de l'écriture chinoise ancienne.

Le principal os animal utilisé pour créer les os de l'oracle était l'omoplate ou l'omoplate. Les bœufs semblent être l'animal préféré, car les archives archéologiques ont révélé une grande quantité d'os d'oracle fabriqués à partir de l'omoplate de cet animal. Néanmoins, des os d'oracle ont également été trouvés, fabriqués à partir d'omoplates de cerfs, de moutons et de porcs. Quant au second matériau, c'est le plastron (le dessous presque plat de la tortue) qui a été utilisé. La carapace (la carapace supérieure convexe de la tortue) n'était pas adaptée à la fabrication d'os d'oracle, car il était beaucoup plus difficile d'écrire sur sa surface incurvée.

Les inscriptions des ossements d'oracle ont été découvertes pour la première fois en 1899 par l'académicien et antiquaire Wang Yirong à Pékin, bien qu'un groupe d'agriculteurs d'Anyang ait déterré des artefacts bien avant le professeur. Au cours du 20 e siècle, des milliers d'ossements d'oracles ont été retrouvés. Diverses études sur les os d'oracle ont montré la façon dont l'écriture chinoise s'est développée au fil du temps, ont mis en lumière les pratiques divinatoires de la dynastie Shang.

Le processus de deviner l'avenir à l'aide d'os d'oracle commence généralement par une question posée par un client. Ces questions portaient sur un large éventail de sujets, notamment des problèmes météorologiques, agricoles et militaires. Le devin utilisait ensuite un outil pointu pour écrire la question sur l'os / la coquille, après quoi un trou / des trous y seraient percés. L'os de l'oracle serait ensuite placé sous une chaleur intense jusqu'à ce que des fissures se produisent. Enfin, ces craquements étaient interprétés par les devins pour leurs clients.


Sources de données et méthodes

Les signes notés dans ce travail font référence à plusieurs auteurs (Mahadevan, 1977 Parpola, 1986, 1994 Wells, 1998), CISI (Joshi et Parpola, 1987 Parpola et al., 2010 Shah et Parpola, 1991) et à l'ensemble de données ICIT. L'ensemble de données sur lequel nous nous concentrons a été organisé et vérifié de deux manières. Premièrement, à la main (en utilisant les listes de signes d'autres auteurs et CISI), et deuxièmement, en utilisant la base de données ICIT comme ressource. Chaque signe sur les sceaux en question était stocké dans une base de données MongoDB. Les signes sur lesquels nous nous sommes concentrés pour le symétrique/asymétrique étaient un domaine principal qui nous a permis de nous concentrer sur leur relation avec d'autres signes du sceau et des sceaux similaires. Les attributs suivants ont été stockés pour chaque sceau : identifiant CISI, numéro de signe, emplacement, autres signes sur le sceau, longueur du sceau et un drapeau pour indiquer s'il s'agissait d'un sceau multiligne. Chaque sceau est stocké en tant que document qui possède les propriétés susmentionnées. Contrairement aux bases de données traditionnelles, la base de données MongoDB permet d'effectuer plusieurs corrélations avec un signe et permet également une analyse plus facile. Chacune des fréquences répertoriées dans ce travail est facilement tabulée en interrogeant l'ensemble de données. Cette configuration de base de données pourrait s'étendre à l'avenir pour analyser davantage les phoques avec des symboles d'animaux.


Civilisations anciennes et écriture ancienne

L'écriture a évolué indépendamment dans diverses régions, telles que le Proche-Orient, la Chine, la vallée de l'Indus et l'Amérique centrale. Les systèmes d'écriture qui ont émergé dans chacune de ces régions sont différents et ne s'influencent pas mutuellement. Le premier système d'écriture connu était cunéiforme en Mésopotamie, qui remonte à 3 100 av.

Pourquoi l'écriture a-t-elle été inventée ? Peut-être que la réponse se trouve dans les premiers messages écrits. Dans la plupart des endroits où l'écriture s'est développée indépendamment, les documents les plus anciens qui restent sont des étiquettes et des listes, ou les noms des dirigeants. En général, certains étaient beaucoup plus riches que d'autres dans les sociétés qui produisaient ces documents, et le pouvoir était concentré entre les mains de petits groupes. Par conséquent, l'écriture est supposée avoir été inventée car les membres de ces groupes ont dû organiser la distribution des biens et des personnes afin de garder le contrôle sur les deux.

Dans de nombreuses sociétés, l'écriture a également été inventée à d'autres fins. Par exemple, dans l'ancienne Mésopotamie, des contrats et d'autres documents commerciaux, des lettres, des lois, des rituels religieux et même des œuvres littéraires étaient écrits. En revanche, en Amérique centrale, l'écriture s'est longtemps limitée aux inscriptions sur les monuments relatifs à la monarchie. Dans ces sociétés où l'écriture était réservée à un petit groupe dominant, il y avait en réalité très peu de personnes sachant lire et écrire.

Écriture logographique

Selon leur mode de fonctionnement, les systèmes d'écriture sont classés en logographique, syllabique ou alphabétique. Parfois, certains systèmes en utilisent plusieurs à la fois. Par exemple, les anciens Égyptiens utilisaient les trois systèmes simultanément. Dans les systèmes d'écriture logographique, chaque symbole représente un mot. Dans beaucoup de ces systèmes, des déterminants grammaticaux sont ajoutés aux symboles de base. Il s'agit de symboles spéciaux indiquant des changements sémantiques ou grammaticaux, tels que des formes composées ou plurielles de mots. La difficulté la plus évidente de ce système d'écriture est le nombre énorme de symboles nécessaires pour exprimer chaque mot. Le système d'écriture chinois utilise environ 50 000 caractères, bien que tous ne soient pas couramment utilisés. Cela explique pourquoi il n'est pas surprenant que très peu de gens savaient lire et écrire dans la Chine impériale. Même à l'époque moderne, il a fallu plusieurs décennies pour créer une machine à écrire en chinois.

Écriture syllabique

Les systèmes d'écriture syllabique utilisent des symboles pour représenter les syllabes. De nombreux premiers systèmes d'écriture étaient syllabiques : cunéiforme assyrien et babylonien au Proche-Orient, les deux systèmes d'écriture de la Grèce préclassique, le kana japonais et l'ancienne écriture maya d'Amérique centrale.

Babylonian cuneiform is a good example of how syllabic writing was used and developed. It first developed from Sumerian logographic writing, and both were written by imprinting wedge-shaped marks on wet clay tablets. They would put syllabic signs one after the other to form words.

Cuneiform syllabic writing was used for a long time in the ancient Near East, where it was in use between the years 3,100 and 100 BC. It was used to write other languages as well as Akkadian, such as Hittite and Elamite.

Babylonian cuneiform has around 600 symbols, although many of them are used for their different syllabic values.

Alphabetic Writing

Most modern languages use alphabetic writing systems where each symbol represents a basic sound. Spanish and most modern European languages are written with alphabets that come from the Latin alphabet. The great advantage of alphabetical systems is that far fewer symbols need to be learned than in logographic or syllabic systems, as most alphabets feature fewer than 30 characters.

It’s rather ironic, but it’s possible that the invention of the first alphabet was inspired by the ancient Egyptian script, one of the most complex writing systems ever invented. Egyptian hieroglyphs combined logographic, syllabic, and alphabetic symbols. In the middle of the second millennium BC, communities living in the Sinai Peninsula discovered that all of the sounds of their language could be expressed using a small number of alphabetic symbols.

It’s likely that the alphabetic systems descended from the original Sinai script were widely used throughout the Levant until 1150 BC. However, as this type of script was mostly written on perishable materials like parchment and papyrus, very few original materials remain. However, papyrus has been preserved in Egypt due to of the dryness of the desert and the absence of bacteria.

The earliest examples of alphabetic writing, which date from 1450 to 1150 BC, were found at the site of the ancient Canaanite city of Ugarit. A writing system consisting of 30 cuneiform symbols was invented to write in Ugaritic. Ugaritic written documents were engraved on clay tablets that are almost indestructible when baked. However, the few remaining documents suggest that the inhabitants of Ugarit were more accustomed to the usual Semitic alphabetic writing tradition of writing on perishable materials.

A very late, and particularly special, example of a surviving original Semitic parchment is the so-called Dead Sea Scrolls. Dating from about 100 BC to 68 AD, these mysterious religious texts written in Aramaic and Hebrew were found between 1947 and 1956 in clay pots in an Israeli desert cave. It’s easier to trace the evolution of the Levantine alphabets used in Semitic languages like Phoenician, Hebrew, and Aramaic after 1200 BC, as there are a few inscriptions carved in stone.

These alphabetic scripts differ from how modern European alphabetic writing is used in two important respects. Firstly, in Semitic writing texts are normally written right to left, instead of left to right. Secondly, vowel sounds and diphthongs in languages that use Semitic scripts (a, e, i, o, u, o, ai, oo, etc.) are not written, and only consonants are recorded (b, k, d, f, g, etc.).

It seems that the writing of vowel sounds occurred by accident, and it wasn’t some sort of brilliant invention. The Greeks were aware of the Levantine alphabets by having established regular contact with the Phoenicians and other peoples of the region between 950 and 850 BC, when they both, among others, established markets throughout the Mediterranean. Some letters that represent consonants in the Semitic sense sounded like vowels to the Greeks.

The Greeks also took their alphabet to Italy, where it was adapted for use in Etruscan, Latin, and other languages. The Roman Empire helped to spread their alphabet throughout much of Western Europe, although the Greek alphabet was still used in the Eastern Empire. By the time the Western Roman Empire fell in the 5th century, it was already a Christian empire. Writing (in Latin) had become essential in ecclesiastical administration. Both the Latin writing system and Christianity survived the empire that gave birth to them. During the early medieval period, the Latin alphabet was adapted to transcribe various languages, such as Gothic, Old Irish, French and Old English. Meanwhile, in the East, the Greek Orthodox Church expanded to the north, Russia and the Balkans, taking the Greek alphabet with them. It’s said that two Orthodox clerics, St. Cyril and St. Methodius, adapted the Greek alphabet to write Slavic languages. This is why the alphabet currently used in Russia, Bulgaria and other parts of Eastern Europe is called Cyrillic, in honor of St. Cyril. In this way, the Semitic, Greek, and Latin alphabets served as the basis of most of the alphabets currently used in modern Europe, the Middle East, and the Indian subcontinent.


Contenu

Human communication was initiated with the origin of speech approximately 500,000 BCE [ citation requise ] . Symbols were developed about 30,000 years ago. The imperfection of speech, which nonetheless allowed easier dissemination of ideas and eventually resulted in the creation of new forms of communications, improving both the range at which people could communicate and the longevity of the information. All of those inventions were based on the key concept of the symbol.

The oldest known symbols created for the purpose of communication were cave paintings, a form of rock art, dating to the Upper Paleolithic age. The oldest known cave painting is located within Chauvet Cave, dated to around 30,000 BC. [1] These paintings contained increasing amounts of information: people may have created the first calendar as far back as 15,000 years ago. [2] The connection between drawing and writing is further shown by linguistics: in Ancient Egypt and Ancient Greece the concepts and words of drawing and writing were one and the same (Egyptian: 's-sh', Greek: 'graphein'). [3]

The next advancement in the history of communications came with the production of petroglyphs, carvings into a rock surface. It took about 20,000 years for homo sapiens to move from the first cave paintings to the first petroglyphs, which are dated to approximately the Neolithic and late Upper Paleolithic boundary, about 10,000 to 12,000 years ago.

It is possible that Homo sapiens (humans) of that time used some other forms of communication, often for mnemonic purposes - specially arranged stones, symbols carved in wood or earth, quipu-like ropes, tattoos, but little other than the most durable carved stones has survived to modern times and we can only speculate about their existence based on our observation of still existing 'hunter-gatherer' cultures such as those of Africa or Oceania. [4]

A pictogram (pictograph) is a symbol representing a concept, object, activity, place or event by illustration. Pictography is a form of proto-writing whereby ideas are transmitted through drawing. Pictographs were the next step in the evolution of communication: the most important difference between petroglyphs and pictograms is that petroglyphs are simply showing an event, but pictograms are telling a story about the event, thus they can for example be ordered chronologically.

Pictograms were used by various ancient cultures all over the world since around 9000 BC, when tokens marked with simple pictures began to be used to label basic farm produce, and become increasingly popular around 6000–5000 BC.

They were the basis of cuneiform [5] and hieroglyphs, and began to develop into logographic writing systems around 5000 BC.

Pictograms, in turn, evolved into ideograms, graphical symbols that represent an idea. Their ancestors, the pictograms, could represent only something resembling their form: therefore a pictogram of a circle could represent a sun, but not concepts like 'heat', 'light', 'day' or 'Great God of the Sun'. Ideograms, on the other hand, could convey more abstract concepts, so that for example an ideogram of

Because some ideas are universal, many different cultures developed similar ideograms. For example, an eye with a tear means 'sadness' in Native American ideograms in California, as it does for the Aztecs, the early Chinese and the Egyptians. [ citation requise ]

Early scripts Edit

The oldest-known forms of writing were primarily logographic in nature, based on pictographic and ideographic elements. Most writing systems can be broadly divided into three categories: logographic, syllabic et alphabetic (ou segmental) however, all three may be found in any given writing system in varying proportions, often making it difficult to categorise a system uniquely.

The invention of the first writing systems is roughly contemporary with the beginning of the Bronze Age in the late Neolithic of the late 4000 BC. The first writing system is generally believed to have been invented in pre-historic Sumer and developed by the late 3000's BC into cuneiform. Egyptian hieroglyphs, and the undeciphered Proto-Elamite writing system and Indus Valley script also date to this era, though a few scholars have questioned the Indus Valley script's status as a writing system.

The original Sumerian writing system was derived from a system of clay tokens used to represent commodities. By the end of the 4th millennium BC, this had evolved into a method of keeping accounts, using a round-shaped stylus impressed into soft clay at different angles for recording numbers. This was gradually augmented with pictographic writing using a sharp stylus to indicate what was being counted. Round-stylus and sharp-stylus writing was gradually replaced about 2700–2000 BC by writing using a wedge-shaped stylus (hence the term cuneiform), at first only for logograms, but developed to include phonetic elements by the 2800 BC. About 2600 BC cuneiform began to represent syllables of spoken Sumerian language.

Finally, cuneiform writing became a general purpose writing system for logograms, syllables, and numbers. By the 26th century BC, this script had been adapted to another Mesopotamian language, Akkadian, and from there to others such as Hurrian, and Hittite. Scripts similar in appearance to this writing system include those for Ugaritic and Old Persian.

The Chinese script may have originated independently of the Middle Eastern scripts, around the 16th century BC (early Shang Dynasty), out of a late neolithic Chinese system of proto-writing dating back to c. 6000 BC. The pre-Columbian writing systems of the Americas, including Olmec and Mayan, are also generally believed to have had independent origins.

Alphabet Edit

The first pure alphabets (properly, "abjads", mapping single symbols to single phonemes, but not necessarily each phoneme to a symbol) emerged around 2000 BC in Ancient Egypt, but by then alphabetic principles had already been incorporated into Egyptian hieroglyphs for a millennium (see Middle Bronze Age alphabets).

By 2700 BC, Egyptian writing had a set of some 22 hieroglyphs to represent syllables that begin with a single consonant of their language, plus a vowel (or no vowel) to be supplied by the native speaker. These glyphs were used as pronunciation guides for logograms, to write grammatical inflections, and, later, to transcribe loan words and foreign names.

However, although seemingly alphabetic in nature, the original Egyptian uniliterals were not a system and were never used by themselves to encode Egyptian speech. In the Middle Bronze Age an apparently "alphabetic" system is thought by some to have been developed in central Egypt around 1700 BC for or by Semitic workers, but we cannot read these early writings and their exact nature remains open to interpretation.

Over the next five centuries this Semitic "alphabet" (really a syllabary like Phoenician writing) seems to have spread north. All subsequent alphabets around the world [ citation requise ] with the sole exception of Korean Hangul have either descended from it, or been inspired by one of its descendants.

Scholars agree that there is a relationship between the West-Semitic alphabet and the creation of the Greek alphabet. There is debate between scholars regarding the earliest uses of the Greek alphabet because of the changes that were made to create the Greek alphabet. [6]

The Greek alphabet had the following characteristics:

  1. The Greek lettering we know of today traces back to the eighth century B.C.
  2. Early Greek scripts used the twenty-two West-Semitic letters, and included five supplementary letters.
  3. Early Greek was not uniform in structure, and had many local variations.
  4. The Greek lettering was written using a lapidary style of writing.
  5. Greek was written in a boustrophedon style.

Scholars believe that at one point in time, early Greek scripts were very close to the West-Semitic alphabet. Over time, the changes that were made to the Greek alphabet were introduced as a result of the need for the Greeks to find a better way to express their spoken language in a more accurate way. [6]

Storytelling Edit

Verbal communication is one of the earliest forms of human communication, the oral tradition of storytelling has dated back to various times in history. The development of communication in its oral form can be categorized based on certain historical periods. The complexity of oral communication has always been reflective based on the circumstance of the time period. Verbal communication was never bound to one specific area, instead, it had and continues to be a globally shared tradition of communication. [7] People communicated through song, poems, and chants, as some examples. People would gather in groups and pass down stories, myths, and history. Oral poets from Indo-European regions were known as "weavers of words" for their mastery over the spoken word and ability to tell stories. [8] Nomadic people also had oral traditions that they used to tell stories of the history of their people to pass them on to the next generation.

Nomadic tribes have been the torch bearers of oral storytelling. Nomads of Arabia are one example of the many nomadic tribes that have continued through history to use oral storytelling as a tool to tell their histories and the story of their people. Due to the nature of nomadic life, these individuals were often left without architecture and possessions to call their own, and often left little to no traces of themselves. [9] The richness of the nomadic life and culture is preserved by early Muslim scholars who collect the poems and stories that are handed down from generation to generation. Poems created by these Arabic nomads are passed down by specialists known as sha'ir. These individuals spread the stories and histories of these nomadic tribes, and often in times of war, would strengthen morale within members of given tribes through these stories. [ citation requise ]

In its natural form, oral communication was, and has continued to be, one of the best ways for humans to spread their message, history, and traditions to the world. [ citation requise ]

Timeline of writing technology Edit

  • 30,000 BC – In ice-age Europe, people mark ivory, bone, and stone with patterns to keep track of time, using a lunar calendar. [dix]
  • 14,000 BC – In what is now Mezhirich, Ukraine, the first known artifact with a map on it is made using bone. [dix]
  • Prior to 3500 BC – Communication was carried out through paintings of indigenous tribes. – The Sumerians develop cuneiform writing and the Egyptians develop hieroglyphic writing.
  • 16th century BC – The Phoenicians develop an alphabet.
  • 105 – Tsai Lun invents paper.
  • 7th century – Hindu-Malayan empires write legal documents on copper plate scrolls, and write other documents on more perishable media.
  • 751 – Paper is introduced to the Muslim world after the Battle of Talas.
  • 1250 – The quill is used for writing. [dix]
  • 1305 – The Chinese develop wooden blockmovable type printing.
  • 1450 – Johannes Gutenberg invents a printing press with metal movable type.
  • 1844 – Charles Fenerty produces paper from a wood pulp, eliminating rag paper which was in limited supply.
  • 1849 – Associated Press organizes Nova Scotiapony express to carry latest European news for New York newspapers.
  • 1958 – Chester Carlson presents the first photocopier suitable for office use.

The history of telecommunication - the transmission of signals over a distance for the purpose of communication - began thousands of years ago with the use of smoke signals and drums in Africa, America and parts of Asia. In the 1790s the first fixed semaphore systems emerged in Europe however it was not until the 1830s that electrical telecommunication systems started to appear.


Which undeciphered writing system has the largest corpus of text? - Histoire

Ancient History relies on disciplines such as Epigraphy, the study of ancient inscribed texts, for evidence of the recorded past. However, these texts, “inscriptions”, are often damaged over the centuries, and illegible parts of the text must be restored by specialists, known as epigraphists. This work presents PYTHIA, the first ancient text restoration model that recovers missing characters from a damaged text input using deep neural networks. Its architecture is carefully designed to handle longterm context information, and deal efficiently with missing or corrupted character and word representations. To train it, we wrote a nontrivial pipeline to convert PHI, the largest digital corpus of ancient Greek inscriptions, to machine actionable text, which we call PHI-ML. On PHI-ML, PYTHIA’s predictions achieve a 30.1% character error rate, compared to the 57.3% of human epigraphists. Moreover, in 73.5% of cases the ground-truth sequence was among the Top-20 hypotheses of PYTHIA, which effectively demonstrates the impact of this assistive method on the field of digital epigraphy, and sets the state-of-the-art in ancient text restoration.

Authors' Notes

Historians rely on different sources to reconstruct the thought, society and history of past civilisations. Many of these sources are text-based – whether written on scrolls or carved into stone, the preserved records of the past help shed light on ancient societies. However, these records of our ancient cultural heritage are often incomplete: due to deliberate destruction, or erosion and fragmentation over time. This is the case for inscriptions: texts written on a durable surface (such as stone, ceramic, metal) by individuals, groups and institutions of the past, and which are the focus of the discipline called epigraphy . Thousands of inscriptions have survived to our day but the majority have suffered damage over the centuries, and parts of the text are illegible or lost (Figure 1). The reconstruction ("restoration") of these documents is complex and time consuming, but necessary for a deeper understanding of civilisations past.

One of the issues with discerning meaning from incomplete fragments of text is that there are often multiple possible solutions. In many word games and puzzles, players guess letters to complete a word or phrase – the more letters that are specified, the more constrained the possible solutions become. But unlike these games, where players have to guess a phrase in isolation, historians restoring a text can estimate the likelihood of different possible solutions based on other context clues in the inscription – such as grammatical and linguistic considerations, layout and shape, textual parallels, and historical context. Now, by using machine learning trained on ancient texts, we’ve built a system that can furnish a more complete and systematically ranked list of possible solutions, which we hope will augment historians’ understanding of a text.

Figure 1: Damaged inscription: a decree of the Athenian Assembly relating to the management of the Acropolis (dating 485/4 BCE). IG I3 4B. (CC BY-SA 3.0, WikiMedia)

Pythia

Pythia – which takes its name from the woman who delivered the god Apollo's oracular responses at the Greek sanctuary of Delphi – is the first ancient text restoration model that recovers missing characters from a damaged text input using deep neural networks. Bringing together the disciplines of ancient history and deep learning, the present work offers a fully automated aid to the text restoration task, providing ancient historians with multiple textual restorations, as well as the confidence level for each hypothesis.

Pythia takes a sequence of damaged text as input, and is trained to predict character sequences comprising hypothesised restorations of ancient Greek inscriptions (texts written in the Greek alphabet dating between the seventh century BCE and the fifth century CE). The architecture works at both the character- and word-level, thereby effectively handling long-term context information, and dealing efficiently with incomplete word representations (Figure 2). This makes it applicable to all disciplines dealing with ancient texts ( philology , papyrology , codicology ) and applies to any language (ancient or modern).

Figure 2: Pythia processing the phrase μηδέν ἄγαν ( Mēdèn ágan ) "nothing in excess," a fabled maxim inscribed on Apollo’s temple in Delphi. The letters "γα" are the characters to be predicted, and are annotated with ‘?’. Since ἄ??ν is not a complete word, its embedding is treated as unknown (‘unk’). The decoder outputs correctly "γα".

Experimental evaluation

To train Pythia, we wrote a non-trivial pipeline to convert the largest digital corpus of ancient Greek inscriptions ( PHI Greek Inscriptions ) to machine actionable text, which we call PHI-ML. As shown in Table 1, Pythia’s predictions on PHI-ML achieve a 30.1% character error rate, compared to the 57.3% of evaluated human ancient historians (specifically, these were PhD students from Oxford). Moreover, in 73.5% of cases the ground-truth sequence was among the Top-20 hypotheses of Pythia, which effectively demonstrates the impact of this assistive method on the field of digital epigraphy, and sets the state-of-the-art in ancient text restoration.

Table 1: Pythia's Predictive performance of on PHI-ML.

The importance of context

To evaluate Pythia’s receptiveness to context information and visualise the attention weights at each decoding step, we experimented with the modified lines of an inscription from the city of Pergamon (in modern-day Turkey)*. In the text of Figure 3, the last word is a Greek personal name ending in -ου. We set ἀπολλοδώρου ("Apollodorou") as the personal name, and hid its first 9 characters. This name was specifically chosen because it already appeared within the input text. Pythia attended to the contextually-relevant parts of the text - specifically, ἀπολλοδώρου. The sequence ἀπολλοδώρ was predicted correctly. As a litmus test, we substituted ἀπολλοδώρου in the input text with another personal name of the same length: ἀρτεμιδώρου ("Artemidorou"). The predicted sequence changed accordingly to ἀρτεμιδώρ, thereby illustrating the importance of context in the prediction process.

Figure 3: Visualisation of the attention weights for the decoding of the first 4 missing characters. To aid visualisation, the weights within the area of the characters to be predicted (‘?’) are in green, and in blue for the rest of the text the magnitude of the weights is represented by the colour intensity. The ground-truth text ἀπολλοδώρ appears in the input text, and Pythia attends to the relevant parts of the sequence.

Future research

The combination of machine learning and epigraphy has the potential to impact meaningfully the study of inscribed texts, and widen the scope of the historian’s work. For this reason, we have open-sourced an online Python notebook, Pythia, and PHI-ML’s processing pipeline at https://github.com/sommerschield/ancient-text-restoration , collaborating with scholars at the University of Oxford . By so doing, we hope to aid future research and inspire further interdisciplinary work.

*Specifically, lines b.8- c.5 of the inscription MDAI(A) 32 (1907) 428, 275.


The Story of India’s Many Scripts

While India’s scripts are ancient, technology and modernity are changing their usage patterns.

Only a few years ago, things did not seem to be going well for India’s various alphabets, often known as the Indic or Brahmic scripts after the historical Iron Age script that is the ancestor of modern South and Southeast Asian writing systems. Digitalization and the widespread proliferation of Roman-alphabet keyboards in India meant that Indian users would often transcribe Indian languages using ad hoc Romanizations on the internet and via text.

Yet today, one can’t follow the Indian Twittersphere or Indian content on social media and the rest of the internet without noticing the recent proliferation of Indic script material, particularly Devanagari (the script used for Hindi, Marathi, and Nepali). Technology and innovation helped this process along, and instead of shrinking the sphere of Indic script usage, they allow Indic scripts to be used more broadly, especially at the popular level. The use of Unicode, and the spread of Indic script transliteration and typing interfaces on Google, and on phones—which is how most Indians access the Internet—have all made it much easier to publish online in Indic scripts. Many phones and computers in India are not specifically designed with Indic script keyboards and instead use the Roman alphabet keyboards common in the West. Transliteration software renders this moot. The increased use of Indic-language scripts has also lead to newer and more artistic fonts for Indian languages.

In short, this is a golden age for Indic language script usage, due to technology and increased literacy. This is despite both the proliferation of English-language education in India, and the shoddy quality of public schools in that country. The very nature of modernity, with its mass communication, advertisements, social platforms, and the spread of information and entertainment to everyone with a smartphone, means that everyone will eventually gain and utilize basic literacy, even if by osmosis and not formal education. And most of this literacy in India will be in local languages. This will be the first time in India’s recorded history that its scripts are being used so widely.

India has a long history of writing. While India has been a literate culture for millennia, it has also greatly valued oral knowledge. The ancient Hindu scriptures, the Vedas, the oldest of which dated to around 1500 BCE were memorized verbatim for at least a thousand years, if not more, before being committed to writing. The oldest writing found in the subcontinent is the as yet undeciphered script of the Indus Valley Civilization (IVC), which seems to have been somewhat logo-syllabic in nature. The script fell out of use by 1500 BCE.

The Indus Valley Script. Source: Wikimedia Commons

The linguistic landscape of the subcontinent changed dramatically during the 2nd millennium BCE, so that is is impossible to determine if there is a connection between the IVC script and the next clearly attested script in India, the Brahmi script found in the inscriptions of the Mauryan Emperor Ashoka (ruled 268-232 BCE), especially since they probably represented vastly different, unrelated languages.

The sudden appearance of the Brahmi writing system is one of the great mysteries of writing in India, as there is no evidence of inscriptions beforehand. Another script, the (extinct, childless) Kharosthi of northwest Pakistan and Afghanistan seems to be clearly derived from the imperial Aramaic script used by the Persians who ruled over parts of the Indus Valley for two centuries until the arrival of Alexander the Great. It is unclear if the fully developed Brahmi script was invented by the Mauryan Empire as a result of exposure to Aramaic, but this seems unlikely, particularly since there were advanced states in the Ganges valley and a corpus of Vedic literature dating from before the Mauryan period.

Diplomat Brief

Weekly Newsletter

Get briefed on the story of the week, and developing stories to watch across the Asia-Pacific.

It is more likely that pre-Mauryan inscriptions may still be discovered, and in fact, some Brahmi inscriptions have been found in Tamil Nadu and Sri Lanka dating to the 6th century BCE. Is it possible then, that writing spread from the south to the north, countervening the traditional notion that the Indic scripts originate in the Ganges valley? This may quite possibly be the case, especially since the coasts of southern India were more exposed to foreign trade from the Middle East than northern India, and scripts from traders could have been brought to India this way (the same way the Phoenicians brought their script to Greece). This long gestation period and overland route from southern to northern India may explain why the Brahmi script, even if it is vaguely derived from Middle Eastern alphabets, is so different and nativized, especially relative to the more obviously Middle Eastern-inspired Kharosthi.

The Possible Evolution of Brahmi from Middle Eastern Scripts. Source: Wikimedia Commons

Once the Brahmi script was spread throughout India by the subcontinent-wide Mauryan Empire, it was used by the subcontinent’s elites.However, unlike imperial China with its unified central government and bureaucratic exam system, and Christian and Muslim societies that were united by a written scripture, oral culture and regional differences in India led to the Brahmi script differentiating and evolving into different scripts in various regions of India, a phenomenon that was already occurring by the end of the Maruyan period in the 2nd century BCE. This phenomenon—each literary language having a particular and unique script—is not actually that unique to India, as the various languages of the ancient Near East and Mediterranean also evolved their own scripts from a common source.

The increased need for quicker, daily writing, versus use for monumental inscriptions may have led to the predominance of cursive styles that evolved into India’s modern scripts. Various other factors may have been at play, such as the material used for writing: in South India, scripts became more rounded, as a result of writing on palm leaves, while in North India, cloth and birch bark allowed for more angular lines, and indeed the major division amongst Brahmic scripts is between the southern Indian/Southeast Asian scripts and the northern Indian and Tibetan scripts.

The Differentiation of Brahmi Letter Shapes. Source: Wikimedia Commons

Regional linguistic differences also helped Indic writing proliferate into many scripts in both South and Southeast Asia. It became prestigious for every major language to have its own script, though what evolved into today’s Devanagari (which began to emerge by the 7th century CE) script retained a special prestige due to its close association with Sanskrit. It is unclear if the evolution of Indic scripts into new forms would have ever stopped had it not been for the standardization process that is necessary for a print-oriented mass modern society. Relatively recently, for example, Devanagari spawned new, regional variations such as the Gujarati script, indicating that there was no real “final form” in the evolution of letter shapes in Indic writing. This seems to have remained the case, even when Indic-script users were exposed to the more unchanging Roman and Arabic alphabets.

The Evolution of Letter Shapes. Source: Wikimedia Commons

The change in letter forms leading to new scripts was probably so slow, generation by generation, that the process did not necessarily involve conscious change from one script to another, but a slow evolution of differences in letter formation as texts were copied throughout the ages. A similar development occurred in medieval Europe with the Latin script, but the development of the printing press, and Renaissance ideas about how the Latin script ought to look like led to a typographical convergence.

Brahmi and Devanagari found together on a pillar. Source: Wikimedia Commons

The evolution of Brahmi into so many scripts over time in India does however raise the question of what individuals and scribes thought about the changes upon becoming aware—and they were aware, as inscriptions in multiple different Indian scripts have been found together, like Kannada with Devanagari—of the fact that their contemporary writing systems were divergent in separate regions, and were also vastly different from the forms found in inscriptions and ancient documents. While 19th century scribes of Indian scripts were unable to tell the British what was written on ancient pillars from the Mauryan Era (the British deciphered Brahmi in 1837), this inability to read ancient forms of writing does not always seem to be the case. In fact, there have been examples of Mauryan, Gupta, and early Nagari inscriptions found together, with each subsequent script alluding to the content of what was written before it in a predecessor script.

But that fact that this knowledge was lost over time and that Indian scripts differentiated into so many forms does seem to indicate that literacy was not widespread and was limited to pockets of individuals, a trend which probably accelerated due to the eclipse of a pan-Indian literary culture after the 12th century. Before the emergence of a modern, mass culture throughout India, writing styles and scripts were particular to regions, and even castes, with scribes and merchants often utilizing their own scripts, which were usually simpler forms of the more formal monumental alphabets used for official or religious purposes.

However, modern trends such as the emergence of a politically unified, subcontinent-wide state in India, new scholarship, and technology seem to be reversed the differentiation that has characterized Indian scripts for past 2,000 years. The literacy of hundred of millions of people in native scripts makes it unlikely that the shapes of letters used by millions of people everyday for communication will change anytime soon, as that would lead to confusion and a lack of communication. The standardization and use of some scripts for mass print and online have also led to the decline of caste and trade based scripts, as well as many local variations. Many hitherto unwritten modern languages are now written in established scripts, usually the script most prevalent in that particular state of India’s, instead of evolving a new script for the language.

While India’s scripts are ancient, technology and modernity are changing their usage patterns, and are in fact allowing them to thrive as never before in standardized and widely used forms, as more people gain literacy and access to the internet.


Get around [ edit ]

While Corpus Christi is ostensibly laid out in a classic city-block style, the adaptation of that system to the local geography can make navigation a little confusing. Nevertheless, there are several main roads that traverse nearly the entire city, and these can be used to orient yourself if you find yourself lost.

By car [ edit ]

Most visitors and locals travel around Corpus Christi in cars. Most likely, a rental or personal car is the best way for you to see the city.

The main routes one needs to know to get around efficiently in Corpus Christi are I-37, South Padre Island Drive (TX-358), les Crosstown Expressway (TX-286), et Ocean Drive/Shoreline Boulevard (Ocean Drive is an extension of Shoreline Blvd. for about seven miles along Corpus Christi Bay).

I-37 brings you into town from the west and ends on Shoreline Drive downtown on the Bayfront.

Shoreline Blvd. is a section of about four miles in downtown Corpus Christi along the bay. It begins in the area of the Art Museum of South Texas and leads south, becoming Ocean Drive. Following Ocean Drive takes one through the most scenic part of the city and to its end at the Naval Air Station and Texas A&M.

South Padre Island Drive does not go to South Padre Island (a frequent mistake made by visitors), but is better thought of as the southern section of Padre Island Drive. It is a section of 358 running from I-37 down the southern side of the city from northwest to southeast and ending on Padre Island at Padre Island National Seashore. Along it is the main shopping and dining area for the city. Locals will invariably refer to South Padre Island Drive as S.P.I.D., with the letters always pronounced separately. Visitors should remember that there will not be signs reading SPID. Instead, many read NAS-CCAD (for Naval Air Station and Corpus Christi Army Depot) or TX-358.

Connecting the northern end of S.P.I.D. to the downtown area near where I-37 ends is the Crosstown Expressway.

Les Harbor Bridge takes drivers over the ship channel from downtown to Corpus Christi Beach, a popular destination for tourists.

By public transit [ edit ]

Corpus Christi has a small trolley service (actually buses poorly disguised as trolleys) and a citywide bus service. Both are run by the Corpus Christi Regional Transit Authority, and schedules can be found at their website [11].

There is no Metro, subway, or any other form of a city rail service.

Car rental services can be found at the airport or along S.P.I.D.

Corpus Christi has a marina, for those few lucky enough to travel by water.


Epi-Olmec script

One of the most important Olmec finds was the discovery of an inscribed slab found under the waters of the Acula River near the village of La Mojarra in 1986 in the Mexican state of Veracruz. Dubbed Stela 1 of La Mojarra, this monument was inscribed with 465 glyphs arranged in 21 columns, and the image of a ruler. The writing on it is nothing like any other writing system in Mesoamerica, such as Maya, Zapotec, Mixtec, or Aztec, although like the Maya it also used the Long Count.

However, Stela 1 of La Mojarra is not the only example of its writing system. Most of the monuments that bear glyphs in the same (or similar) writing system are also found near the Isthmus of Tehuantepec, the thin stretch of land that separates the majority of Mexico from its south-eastern states and from Central America, although none has texts as long as the Stela. The famous Tuxtla Statuette, a hand-length nephrite figurine of an almost comedic man dressed in a duck's outfit, bears a Long Count date of 162 CE as well as non-calendric glyphs. Other famous inscriptions include Stela C of Tres Zapotes, with a Long Count date of 32 BCE, and Stela 1 of Chiapa de Corzo (located in Chiapas, Mexico), with an incomplete date conjectured to be 36 BCE. In the site of Cerro de las Mesas, Veracruz, highly erroded monuments also bear Long Count dates, but from the early Classic period at around 450 CE, as well as a large stone version of the Tuxtla Statuette devoid of any text.

Scholars have given this script many names, epi-Olmec was chosen since it is more common in scientific literature. Some have called this script the "La Mojarra script" after the location where the Stela was found. Another name, also based on a geographical name, is the "Isthmian Script", named after the Isthmus of Tehuantepec. You would find all three names used in publications, and websites. Yet another name is the "Tuxtla Script", named after the Tuxtla Statuette as well as the Tuxtla Mountains near which many of the texts have been found.

Left side image of La Mojarra Stela 1, showing a person identified as "Harvester Mountain Lord". Inscriptions in the Isthmian or Epi-Olmec script on the right side of La Mojarra Stela 1

The Epi-Olmec script turned out to be structurally similar to the Maya. It is logophonetic, meaning that one set of the signs, the phonograms, have phonetic values, while the other glyphs, called logograms, represents morpheme. A morpheme is a word or part of a word that cannot be broken further into smaller units with relevant meaning. For instance, the English word beautiful can be broken down into beauty and -ful, neither of which can be broken down further. Beauty is a morpheme because it is a word. Furthermore, -ful carries the meaning of "a lot of", and can also be used with other words, like bountiful, faithful, and others. Hence it is not a unique derivation of beauty, but a morpheme in its own right.

In a logophonetic system, both logograms and phonograms are used. Frequently logograms make up the root of a word whereas phonograms spell out the prefixes and suffixes that modify the root.

The vowel u ("u" with a line through the middle) is a strange vowel. It is a central high vowel, meaning that it's like the common vowel [i] but the position of the peak of the tongue is halfway between the throat and the teeth. You can check out Phonetics for details on how to pronounce it.

All phonograms in the Epi-Olmec script represent syllables. So we call the set of phonograms the syllabary:

The Epi-Olmec culture was a cultural area in the central region of the present-day Mexican state of Veracruz, concentrated in the Papaloapan River basin, a culture that existed during the Late Formative period, from roughly 300 BCE to roughly 250 CE. Epi-Olmec was a successor culture to the Olmec, hence the prefix "epi-" or "post-". Although Epi-Olmec did not attain the far-reaching achievements of that earlier culture, it did realize, with its sophisticated calendrics and writing system, a level of cultural complexity unknown to the Olmecs.