Les articles de Netsources
Nous avons testé les contenus des différents outils de recherche d’information scientifique en accès libre
Notre habitude est de construire des stratégies complexes, mêlant synonymes, mots écrits de différentes façons (crosslink ou « cross link » par exemple), avec des opérateurs booléens, de proximité, des possibilités d’exclure des thématiques et, enfin, de multiples possibilités de combiner des étapes. Autant le dire tout de suite, ces stratégies ne sont pas transposables en l’état dans ces nouveaux outils.
Pour réaliser nos tests, nous avons donc dû utiliser des stratégies relativement simples qui puissent fonctionner sur tous les outils. Nous nous sommes limités aux références d’articles ou de conférences, incluant les preprints qui sont de plus en plus pris en compte. En revanche nous n’avons pas, dans la mesure du possible, pris en compte les chapitres d’ouvrages et les thèses. Les recherches se font dans le titre, ce qui n’est pas toujours simple, certains systèmes n’offrant pas cette option, obligeant à faire des comptages manuels. Nous avons envisagé de tester une recherche par affiliation mais cette fonctionnalité n'est pas disponible dans tous les moteurs.
Cette comparaison entre les serveurs et les outils gratuits ne pouvant se faire que sur des stratégies simples, on laisse de côté la puissance de recherche et le confort d’utilisation pour ne comparer que le nombre de réponses. Par ailleurs, il est évident que ces tests n’ont aucune valeur statistique et que l’on ne peut rien généraliser à partir de leurs résultats.
Maîtriser l'Open Data et l'IA pour transformer et exploiter les données différemment
En France, pays champion européen de l’open data, on parle souvent des startups qui parviennent à exploiter des données accessibles en accès gratuit, pour en faire des services, avec parfois une option payante, à l’instar de Pappers ou Doctrine.
Depuis la démocratisation de l’IA amorcée il y a plus d’un an avec la mise à disposition au public de ChatGPT, suivie depuis par d’autres IA génératives et services afférents, comment le traitement des données ouvertes a-t-il évolué et surtout, est-il davantage accessible à un utilisateur sans formation technique particulière en amont ? Exploration, étape par étape, du traitement des données, de l’extraction à la publication.
Extraction facilitée
Première étape : la collecte des données. Celle-ci peut se faire de deux façons : en téléchargeant un dataset ou en procédant à l’extraction des données sur un document. C’est dans ce second cas que les outils IA interviennent. S’offrent alors deux possibilités d’extraction de données :
- Avec un outil IA où l’on importe un fichier de données.
- Avec un tableur habituel, auquel on ajoute un module IA.
Avec un outil IA
Les outils IA qui permettent d’importer gratuitement des documents à traiter ne prennent pas en charge les formats de bases de données, mais uniquement les formats textes et PDF. Dans ce cas, extraire les données d’un document pour les récupérer sous forme texte ou de tableau est un jeu d’enfant.
IA open source : une opportunité pour le veilleur ?
L’année 2023 a été marquée par la démocratisation des IA génératives. Cette technologie de pointe, qui a émergé sur le marché en 2020, était alors réservée à quelques experts qui payaient une API. Amorcée par la mise sur le marché de l’interface gratuite ChatGPT d’OpenAI, dont la plupart des produits sont devenus payants dans les mois qui ont suivi, cette démocratisation pourrait néanmoins perdurer grâce au développement de modèles de langage sous licence ouverte (ou « open source »).
Cette licence permet en effet d’exploiter un modèle de langage pré-entraîné à moindres frais (moins de 500 dollars dans la plupart des cas et avec des ressources de calcul modestes), ouvrant ainsi l’accès à un large éventail de chercheurs, de développeurs et d’organisations.
Le paysage du veilleur
Des outils difficilement identifiables
Il existe néanmoins quelques freins pour que le veilleur puisse en profiter.
- Premièrement, ces outils restent difficilement identifiables et utilisables malgré les effets d'annonce. La première raison qui rend difficilement identifiables les outils d’IA open source réside dans la définition même d’une « IA open source », laquelle est trop souvent confondue avec la gratuité. Toutefois, pour l’Open Source Initiative (OSI), l’organisation qui défend « une économie du logiciel dépendant de la vente de prestations et non de celle des licences d’utilisation » l’IA open source doit permettre :
- L’étude du fonctionnement du système et l’inspection de ses composants ;
- L’utilisation de son système à n’importe quelle fin, sans avoir à demander la permission ;
- La modification du système pour changer ses recommandations, prédictions ou décisions afin de l’adapter à ses besoins ;
- Le partage du système avec ou sans modifications, à quelque fin que ce soit.
- La deuxième raison qui rend ces outils difficilement identifiables est la difficulté à identifier ce qui est open source dans une IA.
Les clés du paysage médiatique français
Les chiffres clés
• Nombre de titres de presse écrite (2021, Ministère de la Culture) : 3872
• Nombre de radios (2022, Arcom) : + 1000
• Nombre de chaînes de télévision (2022, Arcom) : 30 chaînes nationales
• Classement de médias numériques (2021, Mind Media, par nombre d’abonnés) : Le Monde, L’Équipe, Le Figaro, Ouest-France, Les Échos, Libération, Le Parisien.
Les principaux groupes de presse
Vivendi (V. Bolloré) : Groupe Canal + (Canal+, Canal+ Cinema, Planète+, Canal+ Sport), CNews, C8, CStar), Prisma Media (Géo, Femme actuelle, Gala), Lagardère News (JDD, Europe 1, Paris Match, RFM, Europe 2, Elle International), etc.
Comprendre le paysage médiatique actuel pour maîtriser sa veille
La connaissance des médias est une compétence essentielle du sourcing et de l’analyse dans la veille informationnelle. Pourtant, les professionnels de la veille et des médias ne se côtoient que trop rarement. Or, connaître l’univers - et la diversité - médiatique est justement ce qui permet de constituer un corpus complet, c’est-à-dire qui prend en compte l’ensemble des opinions autour d’une question. Visite guidée, à l’aube d’une prochaine disruption médiatique.
Le paysage médiatique français est constitué d’un grand nombre de titres traditionnels : plus de 5000 titres de presse écrite, radios et chaînes de télévision en 2021, selon les chiffres du ministère de la Culture et de l’Arcom.
• La hiérarchie de l’information de chacun est déterminée par une loi qui s’applique à tous : la loi de proximité (ou loi du mort/kilomètre) selon laquelle l’information considérée comme la plus importante, et qui sera donc mise « à la Une », est celle qui se rapproche le plus de son public. Cette proximité peut être géographique (presse locale ou nationale), sociale (presse en fonction de l’âge, par exemple), affective/émotionnelle ou encore professionnelle.
• Autre spécificité du paysage français, la place prépondérante de l’Agence France Presse (AFP). Celle-ci diffuse ses dépêches aux médias abonnés, c’est-à-dire à l’ensemble des médias mainstream. Ce qui explique que ces derniers commentent et décryptent souvent les mêmes faits, mais en fonction de leur propre ligne éditoriale. Les médias indépendants, eux, n’ont généralement pas le budget pour acheter un tel abonnement. Plus proches du « terrain », ils n’en ont généralement pas l’utilité non plus.
Sourcing : l'info locale se renouvelle
Les médias locaux évoluent et cela impacte directement le sourcing et les pratiques de veille. Comment identifier et intégrer ces sources et verticales dans son sourcing ?
Il y a des veilles et des recherches d’information où la dimension locale est primordiale. L’information locale qu’il faut réussir à capter, c’est alors celle fournie par des journaux locaux, radios et TV locales, collectivités locales, mais aussi par des internautes désireux de partager des informations.
Ces différentes sources vont permettre d’obtenir des informations uniques et stratégiques notamment au niveau de la politique et de l’économie locale.
En France, quand on pense information locale, on pense avant tout à la PQR (presse quotidienne régionale) et à la PHR (presse hebdomadaire régionale) et par extension à un secteur touché de plein fouet par les difficultés rencontrées par la presse depuis des années.
On aurait vite fait d’extrapoler et de se dire que la veille locale en France risque d’être de plus en plus compliquée avec des sources et des informations locales moins nombreuses. Mais malgré ce sombre tableau, l’information locale n’a pas dit son dernier mot et se renforce même à différents niveaux et via différents canaux.
Dans cet article, nous explorons cette évolution et examinons ses répercussions sur la veille et la recherche d’informations.
Comment utiliser les journaux des collectivités locales ?
Les médias des collectivités locales sont des sources essentielles d’informations régionales au rôle bien singulier. Et comme l’intégration de ces ressources dans une veille reste un véritable défi, comment identifier, surveiller et intégrer ces médias à son système de veille.
Parmi les sources utiles pour trouver de l’information locale en France, les journaux des collectivités (communes, communautés de communes, départements ou régions) sont en bonne position. Ces médias ont une place bien à part dans le paysage des médias locaux. Ils ont la forme d’un journal ou d’un magazine, mais sont généralement la voix de l’équipe politique en place, à l’exception des quelques pages réservées à l’opposition.
Une fois que l’on a bien conscience du positionnement et des biais associés à ce type de publication, il n’en reste pas moins qu’on peut y trouver de l’information locale intéressante et parfois exclusive pour sa veille, notamment sous les angles de la politique et de l’économie locale, des acteurs locaux et de l’événementiel local.
Pourtant, réussir à les utiliser pour sa veille est loin d’être simple, car il n’existe à ce jour aucun agrégateur, outil centralisateur pour ce type de contenus et on se retrouve avec une multitude de magazines plus ou moins accessibles aux modalités et formats différents.
Dans cet article, nous verrons comment identifier ces médias, comment les mettre sous surveillance ou effectuer des recherches sur leurs contenus et comment leur trouver une place adéquate dans son système de veille.
Médias et IA : ce que cela change pour la veille
Après les moteurs de recherche et les médias sociaux, l’IA générative redistribue de nouveau les cartes pour les médias d’information. Avec des impacts considérables sur la production, la diffusion et la monétisation du contenu. Comment les médias s’adaptent-ils et comment cela affecte-t-il l’activité de veille ? Petit tour des initiatives en cours.
Dans ses recherches, au cours de ses analyses ou de la réalisation de ses livrables, le professionnel de la veille est de plus en plus exposé, de façon plus ou moins subtile, à l’information en provenance des IA génératives.
Au départ, les réponses créées par les chatbots d’IA générative comme ChatGPT, Bard et quelques autres, lui ont offert un autre mode d’accès à l’information : un accès direct aux réponses, sans cliquer sur les sources. Et cet usage devrait perdurer si l’on en croit la prochaine version de Google, SGE, qui valorise les réponses générées par IA au détriment des résultats de recherche présentés sous forme de liens.
Impacts sur la recherche
Des médias moins visibles dans les résultats des moteurs de recherche
Mais le contenu généré par IA commence aussi à concurrencer les médias sous une autre forme : des sites entièrement créés par IA s’invitent en effet dans les résultats des moteurs de recherche. Leur contenu, écrit pour correspondre aux règles actuelles de SEO, serait même mieux référencé que celui des médias. Récemment, le service américain de notation de l’actualité NewsGuard a identifié près de 600 sites Web (ils étaient 49 en mai dernier) qui fonctionnent avec peu ou pas d’intervention humaine. Et un site généré par l’IA produit jusqu’à 1200 articles par jour, contre 100 pour Le Monde ou 250 pour le New York Times ! Certains sont même financés par la publicité.
Les médias ont donc raison de craindre une baisse de leur propre trafic, qui provient à plus de 90 % de Google. Pour la veille, cela signifie davantage de difficultés à trouver certains contenus en provenance de médias pertinents, soudainement noyés dans des pseudos sites d’actualités générés par l’IA, mais difficiles à identifier, car ils reprennent les codes graphiques des sites d’actualités. Ce qui nécessite donc davantage de rigueur encore en phase de sourcing.
Veille brevet : comment tirer un avantage concurrentiel de la propriété intellectuelle (article en accès libre)
Dans la plupart des entreprises, la veille brevet est souvent négligée. La veille brevet peut pourtant être une source d’informations précieuse pour l’intelligence concurrentielle. Elle permet de suivre l’évolution des technologies, d’identifier les concurrents, et d’exploiter toutes les opportunités de marché en développant une vraie stratégie. Entretien avec Philippe Borne, Délégué Régional de l’INPI pour la Région Grand Est (1), et également rédacteur occasionnel pour notre lettre BASES à titre d’expert.
François Libmann : La veille brevet a un potentiel qui nous semble sous-évalué dans le domaine de l’intelligence concurrentielle. Comment l’interprétez vous ?
Philippe Borne : Beaucoup d’entreprises ont une vision très juridique du brevet, considéré uniquement comme un outil de protection, et donc avec des stratégies brevet très traditionnelles. Et du fait de cette vision, on retrouve la même attitude en ce qui concerne la veille brevet. Cette vision très juridique du brevet en France a pour conséquence qu’il n’est pas tenu compte de son potentiel en tant que source d’informations pour l’intelligence concurrentielle. Cela ne vient, en effet, pas à l’esprit qu’on puisse faire de la veille technologique sur ce type d’information.
(1) Philippe Borne s’exprime ici à titre personnel et les opinions qu’il expose n’engagent que lui-même.
Les outils de base de la propriété industrielle : brevets, marques, dessins et modèles
Une veille peut s’effectuer sur un très grand nombre de sources telles que les publications dans différents types de presse (généraliste, scientifique…), le web et, en particulier Google ou des sites spécialisés, les réseaux sociaux, les visites de foires et salons, les conférences…
Dans un très grand nombre de cas, particulièrement pour la veille technologique et concurrentielle, il ne faut surtout pas négliger les différentes dimensions de la propriété industrielle : brevets, marques ainsi que dessins et modèles.
Tout d’abord, précisons le vocabulaire, car il y a un fort risque de confusion.
● La propriété industrielle est une de deux composantes de la propriété intellectuelle, l’autre étant la propriété littéraire et artistique.
● La propriété industrielle inclut essentiellement les brevets, les marques et les dessins et modèles, ce à quoi nous allons nous intéresser.
Les bases pour se lancer dans la recherche et la veille brevet
On rappellera en premier lieu qu’un brevet est une sorte de contrat entre l’État en général et un inventeur. En échange de l’exclusivité de l’usage d’une technologie sur une durée pouvant, en général, aller jusqu’à 20 ans, la description de cette technologie est rendue publiquement accessible, après une période de 18 mois, et constitue une information scientifique/technique.
Le titulaire du brevet peut exploiter lui-même sa technologie ou décider s’il autorise un/des tiers à l’exploiter et, dans ce cas, sous quelles conditions (vente du brevet, concession d’une licence).
Comment intégrer les brevets à sa veille concurrentielle ?
On oublie trop souvent que les brevets ont un intérêt pour la veille concurrentielle. Et pourtant, en savoir un peu plus sur la politique brevet d’une entreprise est souvent très utile : par exemple, S’il s’agit de l’un de vos concurrents, cela peut être intéressant de connaître les techniques sur lesquelles il dispose d’une capacité d’interdiction, Si c’est un potentiel partenaire, cela peut être très pertinent avant de signer un accord de collaboration de connaître son niveau de sensibilité à la propriété industrielle. Et s’il s’agit d’un des fournisseurs auprès duquel vous vous approvisionnez en composants indispensables, s’il dispose de brevets sur ces composants, cela peut vouloir dire que vous ne pourrez vous fournir ailleurs. Et cette liste est loin d’être exhaustive.
Alors comment collecter des informations sur la politique brevet d’un concurrent, d’un partenaire, d’un fournisseur…. sans se ruiner ? Et comment entrer et comprendre les bases du monde des brevets, qui peut paraître inaccessible aux non-initiés ?
Toutes les données brevet sont publiques, accessibles dans des bases de données dont beaucoup sont en accès libre, comme Espacenet ou Patentscope. Dans cet article, nous allons vous montrer comment les retrouver.
Pour cela nous partirons d’un exemple concret en nous intéressant à la politique brevet de Volocopter, une startup allemande conceptrice d’un taxi volant à propulsion électrique qu’elle ambitionne de faire voler à l’occasion des Jeux olympiques de Paris, à l’été 2024.
Comment utiliser l’information business et l’actualité pour enrichir sa veille brevet ?
Comme nous avons pu le voir dans l’article « Comment enrichir sa veille concurrentielle avec les brevets ? » de ce même numéro, l’information brevet a un rôle à jouer dans tous les types de veille mais l’inverse est aussi vrai. L’information non-brevet, comme l’information business, financière, presse, etc. a aussi un rôle à jouer pour enrichir et améliorer la veille brevet.
C’est ce que nous avons choisi d’explorer dans cet article en partant d’un exemple concret : analyser la politique brevet de Quobly, une start-up française dans le secteur de la recherche quantique qui a récemment fait parler d’elle avec l’entrée de BPI France dans son capital. Nous avons choisi de mener l’enquête uniquement avec des données en libre accès.
NB : Suivant de loin le sujet du quantique, nous savons que les acteurs américains et chinois du domaine y ont une politique brevet très active. Un rapport de Michel Kurek publié en 2020 a établi que sur la période 2010 - 2020 les acteurs chinois sont à l’origine de 5164 familles de brevets, les acteurs américains de 1990 familles, et les acteurs français d’un modeste chiffre de 126 familles.
Débuter avec les outils de recherche brevet
Quoi de mieux pour analyser une politique brevet que de commencer par une recherche dans les brevets. Nous avons utilisé ici l’outil Espacenet (pour savoir comment rechercher sur Espacenet, nous vous invitons à lire l’article « Comment enrichir sa veille concurrentielle avec les brevets ? » dans ce même numéro).
IA, second cerveau : la ‘veille métier’ fait sa révolution
La question de la surcharge informationnelle, créée par l’explosion de la sphère numérique, se pose de façon toujours plus aiguë pour les métiers de l’information.
Cette réalité est clairement mise en évidence dans le premier article de ce nouveau numéro de NETSOURCES, témoignage des défis auxquels sont confrontés veilleurs et documentalistes dans leur veille métier face à la vague IA (« IA et veille métier : les veilleurs dans l’expectative », Netsources N° 165 - juillet/août 2023).
Comment gérer les vagues d’informations potentiellement pertinentes pour nos métiers qui affluent à travers les multiples canaux numériques, newsletters, blogs, sites et apps de presse, réseaux sociaux pour ne citer qu'eux ?
Comment absorber - sans s’y noyer - ces flux qui deviennent peu à peu des éléments structurants de notre système d’information personnel ? Et surtout, comment les professionnels de l’information peuvent-ils les utiliser pour en faire une véritable force au service de leur veille métier, et par là même de leur métier ?
IA et veille métier : les veilleurs dans l’expectative
« Ça va trop vite, c’est difficile de trouver les bonnes sources, il y a trop d’outils et il y a trop d’aspects à maîtriser ». C’est avec ces mots que Franck Guigard, conseiller Performance et Management de l’information au sein de la CCI de la Drôme, résume la vague IA qui a déferlé sur sa veille métier.
Avec l’IA, ce sont non seulement des milliers de nouveaux outils à évaluer, trier, tester… mais c’est aussi toute une méthodologie à revoir :
• Faut-il ajouter des sources spécifiques à sa veille métier ?
• Quels sont les nouveaux mots-clés à surveiller ?
• Comment optimiser son temps de lecture ? Avec un résumé ? Sous quel format ?
• Peut-on la partager de façon plus attractive ? Dans une autre langue ? Sous quel format ?
Même si la veille métier est caractérisée par son objectif prospectif, il n’en demeure pas moins que la « vague IA » a pris de court la majorité des professionnels de l’information. Six mois après l’arrivée de ChatGPT dans le monde de l’information, comment les veilleurs surfent-ils sur la vague ?
Pour le savoir, nous avons interrogé plusieurs professionnels qui ont accepté de partager le fruit de leur réflexion.
Intégrer une dimension IA à sa veille métier infodoc
Le professionnel de l’information se retrouve très touché par le développement exponentiel de l’IA et l’arrivée de ChatGPT au début de l’année 2023, notamment en termes de compétences à développer et en connaissances à acquérir.
Se former et s’informer sur l’IA n’a rien de facile tant il y a un déluge d’informations autour du thème de l’IA, tant l’environnement évolue et change très vite et tant il y a de nouveaux outils qui apparaissent chaque semaine.
Face à ce contexte inédit, le veilleur a 2 possibilités :
1) Soit choisir d’attendre que le tsunami IA passe ou se calme avant de l’intégrer à ses connaissances et pratiques, mais avec le risque d’accumuler beaucoup de retard sur le sujet de l’IA ;
2) Soit intégrer une dimension IA à sa veille métier/infodoc dès maintenant. À condition de la cibler avec des sources très spécifiques s’intéressant uniquement à l’IA. Il est en effet improbable de pouvoir assimiler l’ensemble des informations utiles gravitant autour du thème de l’IA. À ce stade, il vaut mieux par exemple éviter les alertes Web par mot-clé (type Google Alertes) sous peine d’être noyé sous l’information.
Dans cet article, nous vous proposons les sources que nous jugeons les plus utiles pour suivre les dernières grandes actualités de l’IA, réfléchir à son intégration aux pratiques de veille et de recherche et découvrir de nouveaux outils permettant de gagner en efficacité.
Comment révolutionner sa propre veille métier via le concept de second cerveau ?
Dans le monde professionnel, chacun développe en continu les compétences utiles à l’exercice de son métier pour rester à la pointe et devenir d’une certaine façon « la meilleure version professionnelle de soi-même ».
L’une des manières d’y parvenir consiste à faire de la veille métier, c’est-à-dire à analyser les dernières tendances et dernières innovations techniques, s’approprier de nouvelles méthodologies et astuces ou encore être en phase avec les dernières évolutions du marché, ce qui dans le contexte actuel n’est pas une mince affaire.
Difficile en effet de trouver le temps de faire de la veille métier en plus de toutes ses tâches quotidiennes. D’autant que dans un contexte d’explosion numérique, la veille métier englobe de plus en plus de thématiques et génère de plus en plus d’informations à traiter et assimiler.
Et cela ne s’arrête pas là, car on ne fait pas de la veille pour la simple beauté de la veille : l’étape suivante consiste à capitaliser sur ces informations pour les transformer en connaissances, se créer un système de gestion de connaissances personnelles et utiliser tout cela de manière concrète.
On entre alors dans le champ du PKM (Personal Knowledge Management), une discipline qui existe depuis les années 90, mais qui bénéficie aujourd’hui de beaucoup plus de visibilité et qui se démocratise notamment suite à la sortie de l’ouvrage de Tiago Forte « Construire un second cerveau : une méthode complète pour organiser votre vie numérique et libérer votre potentiel créatif », un best-seller paru en 2022 (2023 pour la version française) et vendu à plus de 100 000 exemplaires à travers le monde.
Dans cet article, nous vous expliquons comment les professionnels de l’information peuvent mettre en place ou améliorer leur système de gestion de connaissances personnelles en tirant parti des enseignements de l’ouvrage « Construire un second cerveau » de Tiago Forte.
Comment créer un système de gestion des connaissances personnelles simple, efficace, flexible et pas trop chronophage capable de s’intégrer dans ses activités quotidiennes ?
J’ai testé pour vous : créer un second cerveau numérique pour capitaliser efficacement sur sa veille métier
La veille métier veille/infodoc et la gestion des connaissances qui s’en suit fait partie de mes pratiques depuis de nombreuses années. Cela me permet notamment de rester à jour, m’aide à développer mes compétences métier et me sert aussi à trouver des idées de sujets pour Bases et Netsources, bénéficier d’une base de matière brute pour rédiger des articles, préparer des formations ou des conférences et plus largement nourrir ma réflexion.
Ce système de veille/PKM (Personal Knowledge Management) a évolué avec les années aussi bien au niveau des contenus que des outils et technologies utilisés. Et si depuis quelques années, j’avais un système qui répondait bien à mes besoins et attentes, j’ai pu constater au cours des derniers mois qu’il arrivait un peu à bout de souffle et qu’il était temps de le faire évoluer. En cause : certains outils qui se dégradent, un volume d’informations toujours plus important à prendre en compte sans pour autant avoir plus de temps à y consacrer et des briques intermédiaires de ma réflexion qui continuent à se perdre ou qui prennent trop de temps à être retrouvées.
J’ai donc décidé de tester les méthodes préconisées par Tiago Forte dans son ouvrage « Construire un second cerveau » et par Sönke Ahrens dans « Comment prendre des notes intelligentes ». Retour sur mon expérience et sur les bénéfices apportés.
Productivité : la veille métier fait sa révolution
Cette rubrique « FICHE DE SYNTHESE » se propose d’aider à comprendre en un clin d’œil les informations clés de chaque numéro de NETSOURCES. Cette rubrique sera également déclinée en version pédagogique « pas à pas » et commentée dans nos fiches pédagogiques « Les essentiels de la veille». Bonne lecture !
Problématique : comment gérer le déluge informationnel ?
Le déluge informationnel auquel nous faisons face quotidiennement accapare nos ressources mentales à tel point que nous craignons sans cesse d’oublier quelque chose. Et quand on n’oublie pas, on passe son temps à rechercher.
ChatGPT et IA : ce qui change pour les professionnels de l’information (article en accès libre)
Le déploiement massif de ChatGPT et autres modèles d’IA entraîne une transformation significative des tâches, des processus et de la valeur ajoutée des professionnels de l’information, qui se trouvent en première ligne de cette révolution en cours.
L’aptitude des modèles IA à traiter d’énormes volumes de données transforme notre interaction avec ces dernières. Toutes les étapes de la chaîne informationnelle sont concernées, depuis la recherche jusqu’au livrable et communication client.
Dans ce nouveau numéro de NETSOURCES, nous nous efforçons de saisir de manière tangible l’impact de l’IA sur nos métiers de veilleur, documentaliste ou analyste.
Les clés pour s’approprier l’IA dans son métier de veilleur
L’intelligence artificielle s’invite dans le quotidien des professionnels de l’information. Lancée en tant que prototype le 30 novembre 2022, ChatGPT s’est imposé comme l’application connaissant la croissance la plus rapide de tous les temps. Parallèlement, les enregistrements de noms de domaine en .ai ont augmenté de 156% au cours de la dernière année, contre seulement 27% pour les domaines en .com au cours de la même période, selon Domain Name Stat.
Selon l’OCDE, 14 % des emplois seront ainsi exposés à un enjeu majeur d’automatisation, tandis que 32 % des emplois pourraient être transformés substantiellement. Qu’en est-il pour les professionnels de la veille ?
L’ABC de l’IA
Face à cette ascension fulgurante, il reste difficile d’appréhender son nouvel environnement. Nous nous proposons donc de partager les bases de fonctionnement d’un système IA utiles aux métiers de la veille et de la recherche d’information et d’esquisser, à chaque étape du processus de veille, les premiers bouleversements expérimentés.
Le professionnel de la veille, parce qu’il manipule l’information qui transite entre l’intelligence humaine et l’intelligence artificielle, doit ainsi apprendre de nouveaux modèles de langage et d’apprentissage : ceux utilisés par l’IA.
Lire aussi :
Comment l’IA enrichit les livrables de veille multilingue ? (Netsources N° 163 - mars/avril 2023)
Revue des moteurs de recherche à l’heure de ChatGPT (Bases N° 413 - avril 2023)
Quels outils utiliser pour bénéficier de ChatGPT ? (Bases N° 410 - jan 2023)
Détecter un contenu écrit par ChatGPT : IA face à l’IA (gratuit - 02/2023)
Notre sélection d’annuaires d'outils IA - Article en accès libre (Bases N° 414 - mai 2023)
L’art du prompt pour le professionnel de l’information
L’un des thèmes récurrents autour de ChatGPT et autres IA génératives concerne la question des prompts - c’est-à-dire les requêtes utilisées pour communiquer avec l’IA - avec l’idée que la qualité des réponses et contenus produits par ces outils dépendraient de la qualité des prompts.
A priori rien d’insurmontable pour les professionnels de l’information qui ont toujours appris à interroger et manipuler les différentes générations d’outils pertinents pour l’exercice de leur métier.
Toutefois, cette fois-ci, cette compétence vaudrait de l’or à en croire la société Anthropic (créateur de Claude, l’un des concurrents de ChatGPT) qui propose un poste de « Prompt Engineer and Librarian » avec un salaire débutant à 300 000$ (Source Time et Jobs Lever), bien loin des standards habituels.
Le professionnel de l’information va-t-il enfin être reconnu à sa juste valeur ? Rien n’est moins sûr… Mais toujours est-il qu’aujourd’hui, on ne peut pas faire l’impasse sur l’IA dans l’exercice de son métier.
La compréhension et la maîtrise des prompts est donc un axe-clé qu’il va falloir comprendre et maîtriser.
C’est ce que nous aborderons dans cet article en démêlant le vrai du faux pour faire la différence entre ce qui est vraiment utile pour communiquer avec l’IA et ce qui relève d’arguments purement commerciaux et marketing puis en proposant des éléments de méthodes pour tirer parti au mieux des outils à base d’IA à partir de nos propres tests et de discussions avec plusieurs professionnels qui utilisent l’IA dans leurs pratiques.
Lire aussi :
Comment l’IA enrichit les livrables de veille multilingue ? (Netsources N° 163 - mars/avril 2023)
Revue des moteurs de recherche à l’heure de ChatGPT (Bases N° 413 - avril 2023)
Quels outils utiliser pour bénéficier de ChatGPT ? (Bases N° 410 - jan 2023)
Détecter un contenu écrit par ChatGPT : IA face à l’IA (Gratuit - 02/2023)
Notre sélection d’annuaires d'outils IA (Article en accès libre - Bases N° 414 - mai 2023)
FOCUS IA : les meilleurs outils IA pour résumer et interroger les contenus de la veille
L’IA générative a un rôle à jouer à certaines étapes de la veille et de la recherche d’information et notamment lors de la phase d’analyse notamment pour tout ce qui a trait aux résumés de documents, de pages Web ou encore contenus audio et vidéo et à la possibilité d’interroger et d’interagir avec ces documents.
Sur le papier, tous ces outils pourraient permettre de gagner un temps considérable quand il s’agit de passer au travers de très nombreux et très longs documents. Mais dans la pratique, ces outils sont-ils aussi miraculeux qu’ils le laissent paraître, quels sont leurs avantages mais aussi leurs limites, sont-ils fiables ou bien inventent-ils du contenu, comment les intégrer intelligemment à ses pratiques et comment choisir le bon outil parmi la masse d’outils disponibles.
Dans cet article, nous avons donc exploré l’écosystème de tous ces nouveaux outils de résumés et d’interrogation de contenus textuels car ils sont très nombreux.
Nous en avons ainsi identifié et testé plus de 40, tous apparus au cours de l’année 2023. Seuls quelques-uns sortent véritablement du lot. C’est à eux que nous nous intéresserons dans cet article.
Lire aussi :
Comment l’IA enrichit les livrables de veille multilingue ? (Netsources N° 163 - mars/avril 2023)
Notre sélection d’annuaires d'outils IA - Article en accès libre (Bases N° 414 - mai 2023)
Les outils de Business Intelligence pour créer des analyses visuelles dans un livrable de veille (Netsources N° 162 - jan/fev 2023)
Kagi Search intègre le résumé automatique aux résultats de recherche (Bases N° 409 - dec 2022)
Les résumés automatiques de nouvelle génération au service de la veille (Bases N° 370 - mai 2019)
Comment optimiser son livrable de veille avec l’IA ?
Depuis la sortie du générateur de texte ChatGpt il y a quelques mois, on commence à comprendre que l’impact de l’IA sur les usages du professionnel de l’information concerne surtout la création de contenu.
Pour un professionnel de la veille, celle-ci prend des formes variées, allant d’un format court (une synthèse par exemple) à une littérature plus élaborée (debrief client, plan de veille, étude de marché, etc.).
L’apparition rapide de milliers d’outils IA bouscule les usages et les méthodes de travail, au point de poser la question de l’optimisation de ses livrables. Nous verrons donc :
● En quoi les différents formats sont-ils affectés par les tâches automatisées à l’IA ?
● Comment les outils IA gratuits et freemiums testés modifient-ils les étapes de création d’un livrable ?
Lire aussi :
Comment l’IA enrichit les livrables de veille multilingue ? (Netsources N° 163 - mars/avril 2023)
Revue des moteurs de recherche à l’heure de ChatGPT (Bases N° 413 - avril 2023)
Quels outils utiliser pour bénéficier de ChatGPT ? (Bases N° 410 - jan 2023)
Détecter un contenu écrit par ChatGPT : IA face à l’IA (gratuit - 02/2023)
Notre sélection d’annuaires d'outils IA - Article en accès libre (Bases N° 414 - mai 2023)
L'essentiel de l’IA pour la veille
Cette rubrique « FICHE DE SYNTHESE » se propose d’aider à comprendre en un clin d’œil les informations clés de chaque numéro de NETSOURCES. Cette rubrique sera également déclinée en version pédagogique « pas à pas » et commentée dans nos fiches pédagogiques « Les essentiels de la veille». Bonne lecture !
Le fonctionnement général
Pour comprendre le langage humain, l’IA utilise des modèles de langage constitués de deux choses :
● Des algorithmes (de Machine Learning que l’on traduit par « apprentissage automatisé ») ;
● Un type d’apprentissage plus ou moins supervisé.
Les nouvelles dimensions du multilinguisme pour la veille
Nous sommes à un moment charnière où l’intelligence humaine va s’enrichir considérablement de l’intelligence artificielle pour devenir encore plus puissante. Et les secteurs de l’information, de la communication et de la langue, terrains de prédilection d’un modèle de langage tel que ChatGPT, sont certainement parmi les premiers bénéficiaires de cet enrichissement inédit et renversant. Même si l’on peut naturellement craindre l’autre versant, beaucoup moins optimiste, de cette promesse, avec des effets négatifs encore difficiles à caractériser et à évaluer à ce stade.
Jusqu’à présent le domaine de la veille multilingue exigeait du professionnel qu’il associe à son expertise technique en matière de veille à l’international, une certaine «agilité linguistique», voire de véritables compétences linguistiques. Il est dorénavant boosté par l’irruption de l’IA dans tous les process, du sourcing à la production de livrables, en passant par l’élaboration des stratégies de recherche.
Veille multilingue : comment trouver ses mots ?
Toute veille débute par une phase d’identification des mots-clés qui serviront aux futures requêtes et alertes. Cette étape cruciale se complexifie quand la veille est internationale et nécessite de prendre en compte la question du multilinguisme.
Mais a-t-on encore besoin de maîtriser plusieurs langues étrangères pour identifier les mots-clés d’une veille multilingue ? Les dernières avancées de l’IA et l’arrivée de ChatGPT peuvent-elles nous être utiles lors de cette étape ? Et faut-il à tout prix se lancer directement à la recherche de mots-clés en langues locales que l’on ne maîtrise pas ?
On pourrait penser qu’il faut impérativement commencer par identifier des mots-clés en langue locale alors qu’il est souvent plus judicieux de commencer avec les langues que l’on maîtrise le mieux et pour lesquelles on a des repères et connaissances solides.
Veille internationale : comment trouver des sources en langue étrangère ?
Identifier des sources dans une langue étrangère nécessite de sortir de sa zone de confort. Il faut non seulement se plonger dans un paysage médiatique et culturel différent, mais aussi minimiser son risque d’erreur d’interprétation.
Pour illustrer la méthodologie à suivre, nous prendrons comme exemple la réalisation d’un sourcing pour la mise en place d’une veille sur le marché de la restauration en Malaisie.
Lire aussi :
Sourcing, de la théorie à l’épreuve de la pratique (Netsources N° 146 - mai/juin)
Sourcing : les outils professionnels suffisent-ils pour s’aventurer en terrain inconnu (Netsources N° 146 - mai/juin)
Sourcing : peut-on faire l’impasse sur les recherches en langue locale ? (Netsources N° 146 - mai/juin)
Fiche Pratique : Les sources-clés pour la veille à l’international
S’inspirer des techniques des journalistes pour identifier des sources humaines locales
Comment trouver des interlocuteurs qui permettent d’approfondir sa recherche ?
Identifier mon besoin : les questions à se poser
À l’instar de la première étape de veille, le premier réflexe est de réfléchir à son besoin. Voici les questions à se poser :
1. De quelles compétences ai-je besoin, pour faire quoi ? Par exemple : pour enrichir son sourcing local en identifiant de nouvelles sources, mieux évaluer ses sources, décrypter les pratiques commerciales du pays, etc.
2. Quelle est la nature des informations dont j’ai besoin ? Culturelles, professionnelles, techniques ? A-t-on besoin d’être dans le pays ou non ?
Lire aussi :
Fiche pratique : Comment identifier les meilleurs experts ? (Payant)
Les obstacles à la recherche d’informations financières d’entreprises à l’étranger (Netsources N° 146 - mai/juin 2020)
Comprendre les résultats de sa veille multilingue en un clin d’œil
Lors de sa veille, il n’est pas rare d’identifier ou de collecter des contenus dans des langues que l’on ne maîtrise pas ou pas parfaitement. Mais ce n’est pas parce qu’on est en mesure de trouver les bons mots-clés dans une langue qui n’est pas la sienne que l'on est capable de comprendre et d' analyser des textes. Et c’est là que la traduction automatique vient jouer un rôle crucial.
La traduction automatique avait fait un bond en avant il y a quelques années avec l’introduction de l’IA et du NLP (natural language processing en anglais, ou traitement du langage naturel en français) dans les outils de traduction tels que Google Translate ou DeepL. La qualité des traductions s’en était alors retrouvée clairement améliorée. Aujourd’hui, c’est l’arrivée de ChatGPT et plus largement des IA conversationnelles qui vient changer la donne et le paysage de la traduction automatique.
Pour cet article, nous avons testé les capacités de ChatGPT et de ses acolytes, à l'instar de Perplexity, par rapport aux outils de traduction plus traditionnels comme Google Translate ou DeepL dans un contexte de veille afin de déterminer quelle était la meilleure méthode pour traduire les informations issues de la veille.
Lire aussi :
Les plateformes de veille internationales peuvent-elles intéresser les veilleurs francophones ?
Les outils professionnels suffisent-ils pour s’aventurer en territoire inconnu ?
Comment l’IA enrichit les livrables de veille multilingue ?
La question du multilinguisme intervient également dans la phase de diffusion de la veille quand il s’agit de produire des contenus dans différentes langues : soit en dupliquant les livrables dans différentes langues pour satisfaire les besoins des collaborateurs basés dans différents pays soit pour produire des livrables dans une langue unique que tous les collaborateurs comprennent, dans la majorité des cas l’anglais.
Mais rares sont les veilleurs et professionnels de l’information maîtrisant à la perfection de multiples langues. Et quant à l’anglais, même si nombreux sont ceux qui en ont une maîtrise professionnelle ou avancée, il n’en reste pas moins que produire des contenus dans une langue qui n’est pas sa langue natale prend nécessairement plus de temps et de réflexion.
Comment produire des livrables multilingues et gagner du temps tout en produisant des contenus en « bon anglais » ? C’est ce que nous avons exploré dans cet article.