Je vais vous expliquez pourquoi la science du langage est tellement important et que les linguistes sont centrale. D'ailleurs les politiques le savent bien, on peut ancrer, tel des messages subliminaux en communication. Principe exploré en programmation neurolinguistique basé sur des travaux en cybernétique de l'école de Palo Alto.
L'école de Palo Alto se concentre sur la théorie des systèmes en rapport à la cybernétique et l'approche psychologique et psychosociologique. Par exemple, l'hypnose moderne de Milton Erickson est de cette école, qui a également créé les mouvements de speed seduction plus tard. Il y a des livres qui expliques l'hypnose dans le contexte politique et l'approche du langage.
Une oeuvre qui exploite considérablement cette approche est le Coran. Qui est un livre compilé et ordonnancer pour mettre en place un programme de système d'exploitation. C'est à dire que les musulmans sont soumis au livre sacré et son dogme. C'est bien sur de la cybernétique, mais son approche de sacralisation aborde l'arabe et donc utilise un system de pattern différent en phonétique.
On va prendre un exemple très simple pour expliquer l'approche, un pharaon célèbre qui a été couvert d'or et de météorite à base d'hypatia. je parle bien sur de Thotankhamon. Ce n'est pas Toutankhamon? J'y viens et on parle de controverse linguistique.
Ce mot est un bel exemple de concatenation en informatique de morphème.
Explication
Morphème : La plus petite unité de sens. Contrairement aux phonèmes, les morphèmes ont une signification. Par exemple, "Ankh" en égyptien ancien signifie "vie", "Amon" fait référence à un dieu, et "Tout" est une partie de la construction du nom propre.
Dans le cas de Toutânkhamon, chaque partie de son nom est un morphème avec une signification spécifique dans l'Égypte ancienne :
- Tout (ou Tūt) : signifie "image" ou "forme".
- Ankh : signifie "vie".
- Amon : fait référence au dieu Amon, l'une des divinités majeures de l'Égypte antique.
En arabe: توت عنخ آمون
En hiéroglyphe:
Cela permet d'illustrer, ce que l'on appel la perte d'information ou des systèmes d'abstraction pour occulter, tel que le novlangue. En Hieroglyphique les formes définis réellement le sens, on utilise une image. Ce que l'on appel des idéogrammes. Par exemple on attache l'image d'un cercle, le mot cercle. On ne peut pas appeler l'image du cercle un rectangle. C'est une information absolu et qui est immutable. Les idéogrammes permettent d'exprimer des idées abstraites ou des concepts, tel que en mandarin: 1,2,3 s'écrit avec des traits qui "pondère" des valeurs: 一 , 二, 三
En résumé: Tout, Ankh, Amon, ces éléments sont des morphèmes car ils sont porteurs de sens, contrairement aux phonèmes qui sont les composants sonores de ces mots.
Vous remarquerez que l'on a commencé à contruire des dictionnaires et faire un ordonnancement de base de donnée. C'est à dire que l'on a attaché à une valeur, une clé qui est indexé.
Exemple:
La valeur "Ankh" est attaché à la clé "Vie" comme index.
C'est un système d'indexation ou l'on construit des définition. Le principe des dictionnaires. Les dictionnaires permet d'avoir une définition d'une valeur. Ainsi dans le dictionnaire, celle-ci est plus précise: Croix ansée, signe hiéroglyphique de la vie, signifiant en égyptien le verbe « vivre » ou le nom « vie ». En Hieroglyphe on sait ce que c'est une croix ansée: elle a une image et donc forme précise. Et c'est immutable.
Dans la théorie holistique et des systèmes on utilise un principe que l'on dit >> Le principe de totalité : le tout est plus que la somme de ses parties. Comprendre un système dans sa totalité, c'est dépasser l'analyse de ses éléments intrinsèques.
On a rien inventé avec la systèmique. Ce principe est utilisé depuis des millénaires dans les constellations. A l'origine c'est le système de Plotémée qui en est l'inventeur. Il a codé le ciel. Aujourd'hui il y a 88 constellations.
C'est à dire un exemple avec l'Aigle. On relie des points qui ont des coordonnées pour former un schéma (pattern). La valeur des éléments isolés ne réprésente pas forcément la totalité, même s'il y sont inclus pour construire le schéma.
Trois étoiles principales:
- Altaïr: "Etoile de l'aigle" (origine arabe) - Coord >> asc: 19h 50m 46,68s - dec: +08° 52′ 02,6″
- Tarazed: "La poutre de la balance" (origine persan) - Coord >> asc: 19h 46m 15,57s - dec: +10° 36′ 47,8″
- Okab: "La queue de l'aigle" (origine arabe) - Coord >> asc: 19h 05m 24,61s - dec: +13° 51′ 49,4″
Vous voyez: on créé un système d'indexage, on attache des clés et des valeurs, puis on définit. La somme des parties, la totalité est:
La mythologie grecque antique dit que le magnifique Aquila Eagle se tenait dans la rangée de Zeus, la grande déesse grecque, dans sa guerre tenace contre les Titans des Titans. Aquila portait Zeus et atterrissait sur le sol pour être attaqué par les ennemis de Zeus de Titan. Donc, l’aigle a sauvé Aquila une place de choix parmi les tours.
Ce qui fait que le schéma d'ensemble permet de construire des récits, dont émerge des motifs (pattern). On peut y faire de la datascience avec des requêtes car les données sont ordonnancer et donc y trouver des statistiques.
Continuons notre réflexion.
Prenons un autre exemple. Le mot "éternité". On retrouve le pattern "Ether". C'est à dire que l'on peut rattacher le sens "infini", mais aussi en grec: "Aeon". Voir le symbole: ∞
Pour chercher des patterns spécifiques dans des chaînes de caractères (comme repérer "ether" dans "éternité"), tu peux utiliser des outils en ligne qui exploitent des méthodes de recherche de similarités phonétiques ou basées sur des sous-chaînes. En informatique on utilise le Regex. Il existe des algorithmes comme Soundex ou Metaphore qui permet de trouver des mots avec des correspondances phonétiques similaires. Qui serait parfois des erreurs de traduction linguistique, voir de la corruption de donné tel que "Tout" ou "Thot" dans Toutankhamon. Le langage peut être altéré dans le temps et avoir une perte d'information, en particulier de manière orale tel que le téléphone arabe.
Ne faite pas confiance à l'oral... On déforme très vite les choses. Ecrivez toujours pour retenir une information.
Programmons en python notre recherche de Pattern et de correspondance
Ou peut tout à fait créer un programme en Python qui utilise une liste et un dictionnaire pour rechercher des motifs ou pour effectuer des opérations sur les données. Voici comment tu pourrais lier une liste à un dictionnaire pour rechercher des patterns ou des correspondances spécifiques.
# Liste de chaînes de caractères
words_list = ["éternité", "ether", "éléphant", "été", "estuaire"]
# Dictionnaire de correspondances (clé = mot, valeur = description)
word_dict = {
"éternité": "Infinie durée",
"ether": "Substance éthérée",
"éléphant": "Grand mammifère",
"été": "Saison chaude",
"estuaire": "Embouchure d'un fleuve"
}
# Fonction pour rechercher un pattern dans une liste de mots
def find_pattern_in_list(pattern, words):
matches = [word for word in words if pattern in word]
return matches
# Utilisation de la fonction pour trouver les mots contenant "ether"
pattern = "ether"
matches = find_pattern_in_list(pattern, words_list)
# Impression des résultats avec leurs descriptions depuis le dictionnaire
for match in matches:
if match in word_dict:
print(f"{match}: {word_dict[match]}")
else:
print(f"{match}: Pas de description disponible.")
Wordlist kesako? C'est un terme en informatique, une liste de terme dans un tableau. Il existe des word lists (listes de mots) tirées de dictionnaires entiers que tu peux utiliser dans des programmes Python pour différentes applications, comme des recherches de patterns, de la génération de texte, ou des analyses linguistiques.
NLTK (Natural Language Toolkit) : C'est une bibliothèque Python très utilisée pour le traitement de texte. Elle inclut plusieurs listes de mots issues de différents corpus, y compris des dictionnaires entiers.
Installation:
pip install nltk
Puis dans le code:
import nltk
nltk.download('words')
from nltk.corpus import words
word_list = words.words()
print(word_list[:10]) # Affiche les 10 premiers mots
D'autres projets existent tel que Crubadan. Mais aussi en français sur lexique.org.
Une fois que tu as une word list (par exemple une liste de mots en français ou en anglais), tu peux les lire depuis un fichier texte ou les intégrer directement dans ton code.
Exemple de lecture depuis un fichier texte :
# Lecture d'une word list depuis un fichier texte
with open('french_word_list.txt', 'r', encoding='utf-8') as file:
word_list = file.read().splitlines()
print(word_list[:10]) # Affiche les 10 premiers mots de la liste
Ces listes de mots sont extrêmement utiles pour la recherche de patterns, la génération de mots, l'analyse linguistique, et d'autres applications dans le traitement du langage naturel (NLP).
Bien sur, j'explique quelques principes des sciences cognitives qu'utilise l'intelligence artificielle. Mais on peut aussi faire soit même des découvertes dans les dictionnaires sur des données cachés à travers la linguistique. L'intelligence artificielle peut d'ailleurs altéré le sens ou l'interprétation de la donnée cachée. Le raisonnement n'a rien à voir avec la capacité d'analyse des humains.
Petite image pour résumer (et désinformer). Les zététiciens risquent encore de raler, ils détestent la psychologie... En particulier le raisonnement par analogie qui est un principe islamique: le Qyas. A travers des signes... Mais qu'es-ce qu'un signe? Etudions plus tard la sémiotique. mais c'est une autre histoire et culturel que l'interprétation des signes lié à l'herméneutique.
Des langues peuvent donc altérer le sens et corrompre des dictionnaires. Je vous laisse réflechir sur le français.