Stage Développeur Backend Crawler
Nous répondons généralement sous une semaine
À propos de ChapsVision
En quelques années, ChapsVision s’est imposé comme un acteur européen de référence du Big Data et de l’Intelligence Artificielle.
Notre ambition : permettre aux entreprises et aux organisations publiques d’exploiter leurs données de manière souveraine, sécurisée et intelligente.
Depuis 2019 :
• +380 M€ levés auprès de Bpifrance
• 29+ acquisitions
• ~1 200 collaborateurs.rices
• +1 000 clients grands comptes
• Présence internationale : Canada, États-Unis, Maroc, Belgique, Japon, Allemagne, Espagne…
• Membre du French Tech Next40
Ce que nous construisons :
• Une suite IA dédiée aux entreprises : CRM, Marketing Automation, Commerce Unifié, Analytics
• Des solutions souveraines pour les acteurs stratégiques publics : défense, renseignement, cybersécurité
Le tout s’appuie sur ArgonOS, notre plateforme de traitement massif de données, renforcée par les technologies RAG de Sinequa.
Contexte
Au sein du département OSINT, le stagiaire sera amené à concevoir et développer un crawler internet ainsi que les outils associés de collecte de données à grande échelle mais aussi assurer le nettoyage, l’indexation et la recherche des documents collectés, et évaluer en continu les performances de la chaîne de traitement.
Le stagiaire interviendrait avec autonomie au sein d’une équipe technique, sous la responsabilité du Technical Leader, dans le cadre du remplacement d’un service jusqu’ici assuré par un prestataire externe.
Missions
Écriture d’un crawler internet et des outils de collecte de données associés
Nettoyage et indexation des documents collectés
Recherche et exploitation des données au sein de l’index
Évaluation et optimisation des performances de la chaîne de collecte et de traitement
Participation aux activités transverses, aux projets de l’équipe et au reporting
Participation aux revues de code et aux bonnes pratiques de développement (Git), ainsi qu’aux rituels de l’équipe
Environnement technique
Python ou C#
SQL, Elastic, S3 et API REST
Profil recherché
Formation Bac +5 en école d'ingénieur ou diplôme équivalent
Maîtrise de Python ou C#
Bonne maîtrise de Git et du travail collaboratif sur le code
Compétences appréciées (nice-to-have) : SQL, Elastic, S3 et API REST
Autonomie, esprit d’analyse et goût pour le travail en équipe
Français courant et anglais professionnel
Avantages
- Carte Swile : 11€ / jour travaillé pris en charge à 60%
- Télétravail jusqu’à 3 jours / semaine
- Transport en commun pris en charge à 50%
- Forfait mobilité durable jusqu’à 400€ / an
- CSE comprenant :
Wellpass
Legal Care Ekie
HelloCSE avec cagnotte semestrielle
Diversité & Inclusion
ChapsVision s'inscrit dans une démarche d'inclusion et s'engage à étudier toutes les candidatures aux regards des compétences et qualifications de chacun.
Dans un souci de clarté, l’écriture inclusive n’est pas utilisée dans cette annonce. Les termes employés se réfèrent aussi bien au genre féminin que masculin.
- Département
- Engineering
- Localisations
- Paris
- Statut à distance
- Hybride
À propos de ChapsVision
Spécialiste du traitement de la donnée et de l’intelligence artificielle, ChapsVision permet aux entreprises et organisations gouvernementales de réussir leur transformation digitale et de créer de la valeur grâce à une suite logicielle axée autour de son système d’exploitation de la donnée massive et hétérogène.
A travers des investissements R&D très importants dans le traitement massif de la data et de l’IA, complétés par une stratégie soutenue et ciblée d’acquisitions et de développement à l’international, ChapsVision a constitué rapidement un groupe cohérent adressant des secteurs à forte empreinte data.