Skip to content

Commit

Permalink
Tdu small additions (#12)
Browse files Browse the repository at this point in the history
* adjustements

* missing image

* Biblio links and images cleaning

* move more images

* adding todo list

---------

Co-authored-by: tdurouchoux-dgddi <[email protected]>
  • Loading branch information
tdurouchoux and tdurouchoux-dgddi authored Oct 8, 2024
1 parent 03d5874 commit 13af413
Show file tree
Hide file tree
Showing 11 changed files with 172 additions and 133 deletions.
50 changes: 34 additions & 16 deletions Bibliographie.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -4,40 +4,58 @@

### Généralité

[Qu'est ce que l'IA ?](https://www.technologyreview.com/2024/07/10/1094475/what-is-artificial-intelligence-ai-definitive-guide/)
- [Qu'est ce que l'IA ?](https://www.technologyreview.com/2024/07/10/1094475/what-is-artificial-intelligence-ai-definitive-guide/)

### Guides pour la prise en compte de l'impact de l'IA
[ARCEP & ADEME de 2023](https://www.arcep.fr/uploads/tx_gspublication/note-synthese-au-gouvernement-prospective-2030-2050_mars2023.pdf)
- [What We Learned from a Year of Building with LLMs (Part I)](https://www.oreilly.com/radar/what-we-learned-from-a-year-of-building-with-llms-part-i/)
- [What We Learned from a Year of Building with LLMs (Part II)](https://www.oreilly.com/radar/what-we-learned-from-a-year-of-building-with-llms-part-ii/)

[AFNOR IA frugale](https://normalisation.afnor.org/nos-solutions/afnor-spec/intelligence-artificielle-frugale/)
### Guides pour la prise en compte de l'impact de l'IA

[Guide de recommandation de sécurité de l'ANSSI](https://cyber.gouv.fr/publications/recommandations-de-securite-pour-un-systeme-dia-generative)
- [ARCEP & ADEME de 2023](https://www.arcep.fr/uploads/tx_gspublication/note-synthese-au-gouvernement-prospective-2030-2050_mars2023.pdf)
- [AFNOR IA frugale](https://normalisation.afnor.org/nos-solutions/afnor-spec/intelligence-artificielle-frugale/)
- [Guide de recommandation de sécurité de l'ANSSI](https://cyber.gouv.fr/publications/recommandations-de-securite-pour-un-systeme-dia-generative)

[AI Act](https://artificialintelligenceact.eu/fr/high-level-summary/)
- [AI Act](https://artificialintelligenceact.eu/fr/high-level-summary/)

## II - Développement

### Plateforme de partage de modèles

[HuggingFace](https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard)
- [HuggingFace](https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard)

### Articles de recherche centraux

**Transformers**

[Papier original **'Attention Is All You Need'**](https://arxiv.org/abs/1706.03762)

[Explication illustrée et très détaillée](http://jalammar.github.io/illustrated-transformer/)
- [Papier original **'Attention Is All You Need'**](https://arxiv.org/abs/1706.03762)
- [Explication illustrée et très détaillée](http://jalammar.github.io/illustrated-transformer/)

**Fine-tuning**

[LoRA](https://arxiv.org/abs/2106.09685)
[QLoRA](https://arxiv.org/abs/2305.14314)
[DoRA](https://arxiv.org/abs/2402.09353)
- [LoRA](https://arxiv.org/abs/2106.09685)
- [QLoRA](https://arxiv.org/abs/2305.14314)
- [DoRA](https://arxiv.org/abs/2402.09353)

[DPO](https://arxiv.org/abs/2305.18290)
[KTO](https://arxiv.org/abs/2402.01306)
- [DPO](https://arxiv.org/abs/2305.18290)
- [KTO](https://arxiv.org/abs/2402.01306)

**Bonnes pratiques du prompt engineering**

[Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4](https://arxiv.org/abs/2312.16171)
- [Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4](https://arxiv.org/abs/2312.16171)
- [Graph of Thoughts](https://arxiv.org/pdf/2308.09687)

### Librairies et ressources




**Pipelines et orchestration LLM**
- [LangChain](https://www.langchain.com/)
- [LlamaIndex](https://www.llamaindex.ai/)
- [Haystack](https://haystack.deepset.ai/)

**RAG**
- [Graph RAG]https://microsoft.github.io/graphrag/

**Evaluation**
- [SelfCheckGPT](https://github.com/potsawee/selfcheckgpt)
28 changes: 17 additions & 11 deletions I-Accompagnement/2_Deja_Fait_Admin.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -6,25 +6,31 @@

### A. Cas d’usage
* Dans une enquête incluant un champ « Commentaire », celui-ci peut être analysé par des LLMs afin d’identifier les thématiques saillantes exprimées dans ce champ. Ensuite, pour chacune de ces thématiques, les LLMs peuvent être utilisés pour dégager le sentiment prédominant (ex : positif, négatif, neutre) associé à chacune d’entre elles. In fine, grâce aux LLMs, le champ « Commentaire » peut ainsi être divisé en un nombre N de thématiques, et, pour chacune de ces thématiques, un contenu peut être généré afin de faire ressortir le sentiment majoritaire des répondants à l’enquête.
* Les LLMs peuvent être utilisés pour labelliser les textes d’un corpus (articles de presse, par exemple) traitant d’un sujet (ex : décision de politique monétaire), selon certaines catégories (ex : « décision attendue », « décision surprenante », « ne sait pas »).
* Interroger une base de documents en pdf (retrieval augmented generation). Les documents sont découpés en paragraphes (chunks). Les réponses aux questions posées sont générées sur la base de paragraphes idoines. Les paragraphes qui ont servi à l’élaboration de la réponse sont indiqués en regard de celle-ci, et peuvent être consultés.
* Les LLMs peuvent être utilisés pour labelliser les textes d’un corpus (articles de presse, par exemple) traitant d’un sujet (ex : décision de politique monétaire), selon certaines catégories (ex : « décision attendue », « décision surprenante », « ne sait pas »).
* Interroger une base de documents en pdf (retrieval augmented generation). Les documents sont découpés en paragraphes (chunks). Les réponses aux questions posées sont générées sur la base de paragraphes idoines. Les paragraphes qui ont servi à l’élaboration de la réponse sont indiqués en regard de celle-ci, et peuvent être consultés.
* Requêter sur des bases en SQL : à une interrogation exprimée en langage naturel sur une base en SQL (exemple : « trouve-moi le ratio R »), un code en SQL servant à la requête est renvoyé.
* Chatcoder : sur la base d’une version de code fournie, une discussion en langage naturel est lancée afin soit de corriger une erreur, soit de développer une nouvelle fonction, etc…

* [Albert France Services](https://www.france-services.gouv.fr/taxonomy/term/174#:~:text=%C2%AB%20Albert%20France%20services%20%C2%BB%20facilite%20les,des%20cas%20d%27usage%20donn%C3%A9s.)
1) [Albert - Dinum] : Projet mené par le LabIA de la DINUM

* Albert Tchap ?
- [Albert github](https://github.com/etalab-ia/albert) : Outils de déploiements des modèles Albert
- [Modèles Albert](Ajouter adresse Hugging Face)
- [Albert France Services](https://www.france-services.gouv.fr/taxonomy/term/174#:~:text=%C2%AB%20Albert%20France%20services%20%C2%BB%20facilite%20les,des%20cas%20d%27usage%20donn%C3%A9s.) : Projet à destination de
[France Service](https://www.france-services.gouv.fr/) et visant à appuyer ses conseillers dans la réalisation de leurs missions. Ce projet se base principalement

* [LLamandement](https://gitlab.adullact.net/dgfip/projets-ia/llamandement)
2) [LLamandement](https://gitlab.adullact.net/dgfip/projets-ia/llamandement) - LLM finetuné permettant d'accélerer le traitement d'amendements et projets de loi (notamment via la synthétisation des textes).

### B. Modèles

[Albert github](https://github.com/etalab-ia/albert)
[Albert hugging face]()
> Pour plus de projets IA (au sens large) dans l'administration se référer au lien : https://grist.numerique.gouv.fr/o/beta-gouv-ia/9wTgwEbwqmwW/Ressources/p/1
### C. Datasets
### B. Modèles

### D. Infrastructure
[Albert github](https://github.com/etalab-ia/albert)
[Albert hugging face]()

### C. Datasets

### D. Infrastructure
des modeles
des datasets/open data ?

Loading

0 comments on commit 13af413

Please sign in to comment.