
The European Commission’s AI Office Shares Preliminary Views on the Template for a Summary of Training Data
As part of its efforts to draft the General-Purpose AI Code of Practice, the European Commission’s AI Office is also developing a template for the detailed training data summary. This summary is expected to:
- Be comprehensive rather than overly technical;
- Strike a balance between protecting legitimate interests and safeguarding trade secrets;
- Be simple, effective, and presented in a clear narrative format.
The European Commission’s AI Office has outlined three main sections for the proposed template:
- General Model Information: model identification, date of market placement, and a high-level overview of the training data's size and characteristics.
- List of Data Sources: public and private datasets, crawled and scraped online data, user-sourced contributions, self-sourced synthetic datasets, and other relevant data.
- Data Processing Aspects: rights reservations related to data-mining exceptions and addressing measures to manage unwanted content.
Feel free to reach out to #DGKV AI Governance team members Violetta Kunze and Georgi Sulev for more information.
Службата по ИИ на Европейската комисия сподели своите първоначални виждания за образец на обобщение на данните за обучение
Като част от усилията си за изготвяне на Кодекса за поведение в областта на ИИ с общо предназначение, Службата по ИИ на Европейската комисия разработва и образец за подробно обобщение на данни за обучение. Това резюме трябва:
- Да бъде изчерпателно, но не прекалено техническо;
- Да намери баланс между защитата на законните интереси и опазването на търговските тайни;
- Да бъде опростено, ефективно и представено в ясен разказен формат.
Службата по ИИ на Европейската комисия очертава три основни раздела на предложената структура на образеца:
- Обща информация за модела: идентификация на модела, дата на пускане на пазара и обща характеристика на обема и особеностите на обучителните данни.
- Списък на източниците на данни: публични и частни бази данни; събрани и извлечени данни от онлайн източници; данни, предоставени от потребители; самостоятелно създадени синтетични набори от данни и други.
- Аспекти на обработката на данни: спазване на забраната за автоматизиран анализ на информация и мерките за справяне с нежелано съдържание.
За повече информация можете да се обърнете към членовете на #DGKV AI Governance екип Violetta Kunze и Georgi Sulev.
#AI Act, #GPIA, #AI, #AI Act compliance, #ArtificialIntelligence, #Technology