A strategic partnership created by Érudit and the Public Knowledge Project.

News / Nouvelles

Retrouvez ici l’actualité de Coalition Publica / Find here the latest news of Coalition Publica

Call for projects 2023 / Appel à projets 2023

The 2023 call for proposal is now closed // L’appel à projets 2023 est maintenant terminé.

La version française suit

Call for proposals 2023 - Textual data in SSH

Access the research potential of massive collections of textual data 

As part of Coalition Publica activities, Érudit is developing large corpora of textual data through partnerships with the country's leading documentary institutions: Library and Archives Canada, Bibliothèque et Archives nationales du Québec, Canadiana / CRKN and the Bibliothèque de l'Assemblée nationale du Québec. These corpora include the full text of entire collections of newspapers, scholarly and cultural journals, magazines and government documents published in Canada. 

In total, there are nearly 5 million text files available for computer-assisted analysis. The corpora were updated in the fall of 2022, to improve access and the quality of optical recognition. The collections date back to the 19th century and are unique in their temporal scope. They constitute an important primary resource for research in many disciplines such as history, sociology, linguistics, economics, literature, computer science and information systems. You can find out more by consulting Coalition Publica’s Services for Researchers page or on the corpora documentation.  

 

Eligible projects and use of corpora

Eligible projects must be solely for research purposes and may not be commercially oriented. The research corpora are accessible from the Digital Research Alliance of Canada and Calcul Québec infrastructure. They can be batch downloaded by SSH key or by the big data transfer tool Globus. The processing of textual data corpora requires skills in computer analysis of big data, automated text mining and/or digital humanities. 

Examples of projects carried out with corpora 

 

workshops

To learn more about the research possibilities offered by these corpora and how to use them, we recommend the workshops offered by Calcul Québec and the Digital Research Alliance of Canada.

You can also subscribe to the Calcul Québec newsletter to be informed of upcoming events.

 

Submit an application

We invite you to submit your research project via this short form so that we may efficiently evaluate your data needs. The deadline to apply is March 31, 2023. 

If you have any questions about this call for proposals, you may contact our team at corpus@erudit.org

 

Appel à projets 2023 - Données textuelles en SHS

Accédez au potentiel de recherche de vastes ensembles de données textuelles! 

Dans le cadre des activités de Coalition Publica, Érudit développe de vastes corpus de données textuelles grâce à des partenariats établis avec les principales institutions documentaires au pays : Bibliothèque et Archives Canada, Bibliothèque et Archives nationales du Québec, Canadiana / RCDR et la Bibliothèque de l’Assemblée nationale du Québec. Ces corpus comprennent le plein texte de collections entières de journaux, de revues savantes et culturelles, de magazines et de documents gouvernementaux publiés au Canada. 

Au total, ce sont près de 5 millions de fichiers textuels disponibles pour analyse assistée par ordinateur. Les corpus ont été mis à jour au cours de l’automne 2022, afin de faciliter leur accès et d’améliorer la qualité de la reconnaissance optique des textes. Remontant au 19e siècle, ces corpus sont uniques par leur amplitude temporelle. Ils constituent une ressource de première importance pour la recherche dans de nombreuses disciplines comme l’histoire, la sociologie, la linguistique, l’économie, la littérature, l’informatique et les systèmes d'information.  Vous pouvez en découvrir plus en consultant la page des Services aux chercheurs de Coalition Publica et les pages de Documentation du projet.  

 

Projets admissibles et utilisation des corpus

Les projets admissibles doivent être poursuivis à des fins de recherche et ne peuvent faire l’objet de visées commerciales. Les corpus de recherche sont accessibles depuis l’infrastructure de l’Alliance de recherche numérique du Canada et de Calcul Québec. Ils peuvent être téléchargés en lot par clé SSH ou par l’outil de transfert de données massives Globus. Le traitement des corpus de données textuelles nécessite des compétences en analyse informatique des données massives, en fouille de textes automatisée et/ou en humanités numériques. 

Exemples de projets réalisés avec les corpus 

 

Formations

Pour en apprendre plus sur les possibilités de recherche qu’offrent ces corpus et sur les façons de les utiliser, nous vous recommandons de consulter le programme des formations offertes par Calcul Québec et l’Alliance de recherche numérique du Canada.

Vous pouvez aussi vous inscrire à l’infolettre de Calcul Québec afin d’être au courant des prochains événements.

 

Présenter une demande

Nous vous invitons à présenter rapidement votre projet de recherche dans ce court formulaire pour que nous puissions répondre efficacement à vos besoins en matière de données. La date limite de présentation pour une demande est le 31 mars 2023.

Pour toute question concernant cet appel à projets, vous pouvez communiquer avec notre équipe à l’adresse corpus@erudit.org.

 
Gwendal henry - Érudit