Apple a rรฉcemment publiรฉ un document technique dรฉtaillant les modรจles dรฉveloppรฉs pour Apple Intelligence, une gamme de fonctionnalitรฉs d’IA gรฉnรฉrative prรฉvue pour iOS, macOS et iPadOS.
Dans ce document, Apple rรฉpond aux critiques concernant l’รฉthique de ses mรฉthodes d’entraรฎnement, affirmant qu’elle n’a utilisรฉ que des donnรฉes publiques et sous licence.
Lire aussi :
- Quelles sont les consรฉquences de la suppression des applications VPN par Apple pour les utilisateurs russes ?
- Apple Watch : La nouvelle fonctionnalitรฉ de pause des anneaux d’activitรฉ d’Apple enfin disponible
Sources de donnรฉes et confidentialitรฉ des utilisateurs
Apple assure que les donnรฉes utilisรฉes pour entraรฎner ses modรจles proviennent de sources publiques et sous licence, et non de donnรฉes privรฉes des utilisateurs. Le jeu de donnรฉes de prรฉ-entraรฎnement se compose de donnรฉes sous licence d’รฉditeurs, de jeux de donnรฉes disponibles publiquement ou en open-source, et d’informations accessibles collectรฉes par notre web crawler, Applebot, explique le document. Cette approche vise ร protรฉger la vie privรฉe des utilisateurs d’Apple.
En juillet, des rapports avaient suggรฉrรฉ qu’Apple utilisait un ensemble de donnรฉes contenant des sous-titres de vidรฉos YouTube pour entraรฎner ses modรจles. Face ร la controverse, Apple a clarifiรฉ que ces modรจles ne seraient pas utilisรฉs pour les fonctionnalitรฉs d’IA de ses produits.
Une approche รฉthique et responsable
Le document technique dรฉvoile les Apple Foundation Models (AFM) et insiste sur le fait que les donnรฉes de formation ont รฉtรฉ obtenues de maniรจre responsable. Cela inclut des donnรฉes web accessibles publiquement et des donnรฉes sous licence. Apple a รฉgalement conclu des accords avec plusieurs รฉditeurs pour utiliser leurs archives de contenu, notamment avec NBC, Condรฉ Nast et IAC.
Les modรจles AFM ont รฉtรฉ formรฉs sur du code open-source provenant de GitHub, incluant des langages tels que Swift, Python et Java. Apple affirme avoir sรฉlectionnรฉ uniquement des dรฉpรดts avec des licences permissives, comme celles de type MIT, ISC ou Apache.
Renforcement des compรฉtences des modรจles
Pour amรฉliorer les compรฉtences des modรจles AFM, Apple a inclus dans son jeu de donnรฉes des questions et rรฉponses mathรฉmatiques provenant de diverses sources en ligne. L’entreprise a รฉgalement utilisรฉ des jeux de donnรฉes publics de haute qualitรฉ, soigneusement filtrรฉs pour exclure les informations sensibles. En tout, le jeu de donnรฉes de formation des modรจles AFM comprend environ 6,3 trillions de tokens.
Apple a aussi utilisรฉ des retours humains et des donnรฉes synthรฉtiques pour affiner les modรจles et rรฉduire les comportements indรฉsirables. Nos modรจles sont conรงus pour aider les utilisateurs dans leurs activitรฉs quotidiennes, en accord avec les valeurs fondamentales d’Apple et nos principes d’IA responsable, dรฉclare l’entreprise.
En publiant ce document, Apple tente de se positionner comme un acteur รฉthique dans le domaine de l’IA, tout en รฉvitant les problรจmes juridiques potentiels. L’entreprise permet aux webmasters de bloquer son robot d’indexation pour protรฉger leurs donnรฉes, tout en cherchant ร innover. Les dรฉbats juridiques en cours dรฉtermineront l’avenir des modรจles d’IA gรฉnรฉrative et de leurs mรฉthodes de formation. Pour l’instant, Apple s’efforce de dรฉmontrer sa responsabilitรฉ et son engagement envers la protection de la vie privรฉe et l’รฉthique.