MakeACopy
MakeACopy est une application open source de numérisation de documents pour Android qui vous permet de numériser des documents papier avec OCR. L’application est conçue dans le respect de la vie privée : elle fonctionne entièrement hors ligne, sans cloud ni suivi.
Fonctionnalités
- Numérisation avec l’appareil photo : capturez des documents avec la caméra de l’appareil
- Détection des bords : détection automatique des bords du document avec OpenCV, améliorée par un modèle ONNX (DocAligner)
- Correction de perspective : ajustez et recadrez les documents manuellement ou automatiquement
- Amélioration d’image : appliquez des filtres (niveaux de gris, contraste, netteté)
- OCR : reconnaissance de texte hors ligne avec Tesseract
- Export PDF : enregistrement en PDF interrogeable avec texte reconnu
- Export JPEG : exportez en images JPEG de haute qualité (qualité, couleur/NB configurables)
- Numérisation multipage : combinez plusieurs pages en un seul document ; réorganisez et gérez les pages avant l’export
- Derniers scans : accédez rapidement à vos numérisations récentes
- Partager & Enregistrer : enregistrement local ou partage avec d’autres applications
- Mode sombre : thème Material 3 avec support jour/nuit
- Respect de la vie privée : 100% hors ligne, aucune connexion Internet requise
Langues OCR
MakeACopy prend en charge l’OCR hors ligne via Tesseract. Vous pouvez sélectionner la langue lors de l’étape OCR.
- Anglais (
eng)
- Allemand (
deu)
- Français (
fra)
- Italien (
ita)
- Espagnol (
spa)
- Portugais (
por)
- Néerlandais (
nld)
- Polonais (
pol)
- Tchèque (
ces)
- Slovaque (
slk)
- Hongrois (
hun)
- Roumain (
ron)
- Danois (
dan)
- Norvégien (
nor)
- Suédois (
swe)
- Chinois (simplifié) (
chi_sim)
- Chinois (traditionnel) (
chi_tra)
- Russe (
rus)
- Thaï (
tha)
En plus des APKs de Language-Pack optionnels, vous pouvez aussi ajouter les modèles best officiels de Tesseract depuis le dépôt : tessdata_best. Voir le projet Tesseract : github.com/tesseract-ocr/tesseract.
Language-Pack APK : MakeACopy OCR Latin (Best) – inclut des modèles haute précision pour l’anglais (eng), l’allemand (deu), le français (fra), l’italien (ita), l’espagnol (spa), le portugais (por), le néerlandais (nld), le polonais (pol), le tchèque (ces), le slovaque (slk), le hongrois (hun), le roumain (ron), le danois (dan), le norvégien (nor) et le suédois (swe). Téléchargez-le depuis la page de publication du Language‑Pack.
Remarque : pour le chinois, l’application inclut des polices CJK adaptées pour améliorer le rendu du texte PDF.
Captures d’écran
Guide d’utilisation
- Numériser le document : ouvrez l’application et touchez le bouton de scan pour capturer un document
- Ajuster les coins : peaufinez les bords détectés
- Recadrer & améliorer : appliquez le recadrage et améliorez l’image si nécessaire
- Traitement OCR : l’application reconnaît le texte du document
- Exporter & partager : enregistrez en PDF ou partagez avec d’autres applications
Confidentialité
- Aucune connexion Internet requise
- Aucune requête serveur ni télémétrie
- Traitement OCR local sur votre appareil
- Autorisations requises : Appareil photo, Stockage
- Aucune connexion à des tiers
Pour plus de détails, consultez notre politique de confidentialité.
Installation
F-Droid
MakeACopy est disponible sur F-Droid : f-droid.org/packages/de.schliweb.makeacopy.
Pour la conformité F-Droid, tous les composants natifs sont construits à partir des sources : bibliothèques OpenCV (du
sous-module external/opencv) et ONNX Runtime (XNNPACK et NNAPI, liaisons Java) depuis external/onnxruntime. Les bibliothèques résultantes sont intégrées à l’application pendant la construction ; aucun binaire précompilé n’est stocké dans le dépôt.
GitHub Releases
Vous pouvez télécharger la dernière APK sur la page Releases.
Vérification de l’APK
Pour vérifier l’authenticité des versions de MakeACopy, comparez l’empreinte du certificat de signature ci‑dessous avec la sortie de apksigner ou AppVerifier.
SHA-256
- Clé d’upload (GitHub / F-Droid / APKs en sideload)
AE:32:2D:3F:B7:1A:FE:21:DF:47:27:E3:7A:5C:68:03:51:1D:5A:2F:E1:FC:31:35:43:0C:EE:06:99:FA:1B:34
- Clé de signature Google Play (versions Play Store)
C0:71:44:39:CB:51:62:32:A4:47:91:7A:6F:C2:28:1E:45:FA:AA:DD:37:F8:30:B1:01:1F:B4:85:68:8E:0D:64
Commandes de vérification
# Avec apksigner (depuis Android SDK build-tools)
apksigner verify --print-certs MakeACopy-vX.Y.Z.apk
# Avec AppVerifier (https://github.com/soupslurpr/AppVerifier)
appverifier verify MakeACopy-vX.Y.Z.apk
❤️ Soutenir ce projet
MakeACopy est gratuit et open source. Si l’application vous est utile, pensez à soutenir le développement :
FAQ
Numérisation (Caméra)
- L’image est floue / le texte est difficile à lire
- Assurez un éclairage suffisant ; évitez une lumière d’ambiance faible et chaude.
- Tenez l’appareil bien stable ou appuyez‑le.
- Déclenchez l’autofocus en touchant la zone pertinente dans le viseur (si disponible).
- Éloignez légèrement l’appareil puis recadrez — être trop proche peut nuire à la mise au point.
- Fortes ombres ou reflets
- Éclairez le document uniformément depuis plusieurs côtés.
- Évitez les sources directes provoquant des reflets (p. ex. sur papier brillant).
- Posez le document sur un fond mat et contrasté.
- L’image est trop sombre/clair
- Améliorez l’éclairage.
- N’utilisez le flash qu’en cas de besoin — il peut créer des reflets.
- Perspective déformée
- Prenez la photo le plus perpendiculairement possible à la surface du document.
Détection des bords
- Les bords du document sont mal détectés
- Assurez un bon contraste entre le document et le fond (par ex. papier clair sur table sombre).
- Aplatissez le papier (sans vagues/pliures) et alignez‑le correctement.
- Évitez les ombres pouvant être interprétées comme des bords.
- Aucune détection automatique
- Reprenez la photo avec un meilleur éclairage.
- Utilisez l’ajustement manuel des coins après le scan pour déplacer les points.
- Résultat incliné ou rogné
- Après la détection automatique, vérifiez les quatre points et ajustez‑les manuellement si nécessaire.
OCR (Reconnaissance de texte)
- L’OCR ne reconnaît presque aucun texte
- Vérifiez que la langue correcte est sélectionnée.
- Numérisez en bonne qualité : image nette, lumière suffisante, peu de bruit.
- Évitez les caractères trop petits — remplissez davantage la page ou rapprochez‑vous (sans flou).
- Mauvaise langue / les accents ne sont pas reconnus
- Choisissez la langue OCR appropriée dans l’application.
- Pour une meilleure précision dans les langues latines, installez le Language Pack : MakeACopy OCR Latin (Best) (lien Play Store ci‑dessus sur cette page).
- Langues mélangées dans le document
- Si possible, numérisez les sections séparément par langue.
- Sinon, choisissez la langue principale ; le texte mixte peut réduire la précision.
- L’écriture manuscrite n’est pas reconnue
- Tesseract est principalement prévu pour le texte imprimé ; la reconnaissance manuscrite est limitée.
- De meilleurs résultats avec une écriture claire et proche de l’imprimé ; sinon, envisagez une transcription manuelle.
- Mauvaise rotation/orientation de l’OCR
- L’application détecte automatiquement l’orientation : elle essaie l’OCR en interne par pas de 90° (0°, 90°, 180°, 270°) et retient le meilleur résultat. Si la page est déjà bien orientée, elle s’arrête plus tôt pour gagner du temps.
- Si la page est très inclinée, faites-la pivoter avant l’OCR à l’aide des boutons de rotation par pas de 90°, jusqu’à ce que les lignes de texte soient horizontales.
- Évitez une forte perspective ; alignez le document aussi droit que possible.
- La recherche dans le PDF ne fonctionne pas
- Vérifiez si la langue sélectionnée est correcte ; une mauvaise langue produit un texte reconnu non concordant.
- Vous pouvez aussi exporter le texte OCR séparément en fichier TXT.
- Que signifient les modes de reconnaissance ?
Dans l’application, avant la reconnaissance de texte, vous pouvez choisir comment préparer l’image pour Tesseract :
- Original (sans prétraitement) : Le plus rapide. La photo est transmise telle quelle à l’OCR. Idéal pour des scans propres et très contrastés ; peut manquer du texte pâle ou « sale ».
- OpenCV Rapide : Prétraitement léger et rapide (niveaux de gris, léger débruitage, noir/blanc automatique, éventuellement léger agrandissement). Bon réglage par défaut pour la plupart des photos — bon équilibre entre vitesse et qualité.
- OpenCV Robuste : Précision maximale pour des pages difficiles (redressement/deskew, normalisation de l’éclairage, débruitage préservant les contours, agrandissement intelligent). Produit une image en niveaux de gris de haute qualité pour Tesseract. Meilleure précision, mais plus lent et plus gourmand en mémoire.
Remarque : Pour la plupart des cas, « OpenCV Rapide » est recommandé ; pour des pages très difficiles, utilisez « OpenCV Robuste ».
- Comment gérer les packs de langue / modèles OCR ?
- Ouvrez la vue OCR d’un scan et touchez le menu (⋮) → « Modèles OCR ».
- « Importer .traineddata… » : importer un fichier modèle Tesseract unique depuis l’appareil/le stockage.
- « Découvrir les packs de langue » : trouver les applications Language‑Pack installées (p. ex. « MakeACopy OCR Latin (Best) ») et y importer des modèles.
- « Supprimer le modèle Best » : retirer un modèle Best précédemment importé pour la langue actuellement sélectionnée (le modèle rapide intégré reste disponible).
Astuce : L’application inclut des modèles compacts et rapides. Pour une meilleure précision, vous pouvez installer en option des modèles « Best » plus volumineux via un Language‑Pack (lien en haut de cette page). Aucune connexion Internet n’est requise.
Plus de questions ? Ouvrez un ticket : github.com/egdels/makeacopy/issues.
Licence
MakeACopy est sous licence Apache License 2.0.
Copyright 2025 Christian Kierdorf
Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License.