Language resource management -- Lexical markup framework (LMF) - Part 3: Etymological extension

This document describes an extension to ISO 24613-1 and ISO 24613-2 to support the development of detailed descriptions of common etymological phenomena and/or diachronic information with respect to lexical entries in born-digital and/or retro-digitized lexicons. It provides both a meta-model for such an extension as well as the relevant data categories.

Gestion des ressources linguistiques -- Cadre de balisage lexical (LMF) - Partie 3: Extension étymologique

Le présent document décrit une extension de l’ISO 24613-1 et de l’ISO 24613-2 et facilite l’élaboration des descriptions détaillées de phénomènes étymologiques courants et/ou d’informations diachroniques par rapport aux entrées lexicales des lexiques numériques et/ou rétronumérisés. Il fournit à la fois un métamodèle pour une extension de ce type ainsi que les catégories de données pertinentes.

Upravljanje jezikovnih virov - Ogrodje za označevanje leksikonov (LMF) - 3. del: Etimološka razširitev

General Information

Status
Published
Public Enquiry End Date
14-Mar-2021
Publication Date
04-May-2021
Current Stage
6060 - National Implementation/Publication (Adopted Project)
Start Date
02-Apr-2021
Due Date
07-Jun-2021
Completion Date
05-May-2021

Relations

Buy Standard

Standard
ISO 24613-3:2021 - BARVE
English language
26 pages
sale 10% off
Preview
sale 10% off
Preview
e-Library read for
1 day
Standard
ISO 24613-3:2021 - Language resource management — Lexical markup framework (LMF) — Part 3: Etymological extension Released:3/31/2021
English language
22 pages
sale 15% off
Preview
sale 15% off
Preview
Standard
ISO 24613-3:2021 - Language resource management -- Lexical markup framework (LMF)
English language
22 pages
sale 15% off
Preview
sale 15% off
Preview
Standard
ISO 24613-3:2021 - Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 3: Extension étymologique Released:3/31/2021
French language
22 pages
sale 15% off
Preview
sale 15% off
Preview
Standard
ISO 24613-3:2021 - Gestion des ressources linguistiques -- Cadre de balisage lexical (LMF)
French language
22 pages
sale 15% off
Preview
sale 15% off
Preview

Standards Content (Sample)


SLOVENSKI STANDARD
01-junij-2021
Nadomešča:
SIST ISO 24613:2013
Upravljanje jezikovnih virov - Ogrodje za označevanje leksikonov (LMF) - 3. del:
Etimološka razširitev
Language resource management -- Lexical markup framework (LMF) - Part 3:
Etymological extension
Gestion des ressources linguistiques -- Cadre de balisage lexical (LMF) - Partie 3:
Extension étymologique
Ta slovenski standard je istoveten z: ISO 24613-3:2021
ICS:
01.020 Terminologija (načela in Terminology (principles and
koordinacija) coordination)
01.140.20 Informacijske vede Information sciences
35.240.30 Uporabniške rešitve IT v IT applications in information,
informatiki, dokumentiranju in documentation and
založništvu publishing
2003-01.Slovenski inštitut za standardizacijo. Razmnoževanje celote ali delov tega standarda ni dovoljeno.

INTERNATIONAL ISO
STANDARD 24613-3
First edition
2021-03
Language resource management —
Lexical markup framework (LMF) —
Part 3:
Etymological extension
Gestion des ressources linguistiques — Cadre de balisage lexical
(LMF) —
Partie 3: Extension étymologique
Reference number
©
ISO 2021
© ISO 2021
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting
on the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address
below or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii © ISO 2021 – All rights reserved

Contents Page
Foreword .iv
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 The LMF etymology extension . 2
4.1 The Cognate class and the Etymon class . 2
4.2 The Etymologizable class . 2
4.3 The Etymology class and the EtyLink class . 3
4.4 The CognateSet class . 4
4.5 The Date class . 4
4.6 The Gloss class. 4
Annex A (informative) Examples of possible etymological typologies . 6
Annex B (normative) Data categories for etymology description .15
Bibliography .22
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out
through ISO technical committees. Each member body interested in a subject for which a technical
committee has been established has the right to be represented on that committee. International
organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.
ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of
electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are
described in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the
different types of ISO documents should be noted. This document was drafted in accordance with the
editorial rules of the ISO/IEC Directives, Part 2 (see www .iso .org/ directives).
Attention is drawn to the possibility that some of the elements of this document may be the subject of
patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of
any patent rights identified during the development of the document will be in the Introduction and/or
on the ISO list of patent declarations received (see www .iso .org/ patents).
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and
expressions related to conformity assessment, as well as information about ISO's adherence to the
World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see www .iso .org/
iso/ foreword .html.
This document was prepared by Technical Committee ISO/TC 37, Language and terminology,
Subcommittee SC 4, Language resource management.
This first edition of ISO 24613-3, together with ISO 24613-1:2019, ISO 24613-2:2020, ISO 24613-4:2021
1)
and ISO 24613-5:— , cancels and replaces ISO 24613:2008, which has been technically revised.
The main changes compared to the previous edition are as follows:
— entire revision of the content and its subdivision into several parts.
A list of all parts in the ISO 24613 series can be found on the ISO website.
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www .iso .org/ members .html.
1) Under preparation. Stage at the time of publication: ISO/DIS 24613-5:2020.
iv © ISO 2021 – All rights reserved

INTERNATIONAL STANDARD ISO 24613-3:2021(E)
Language resource management — Lexical markup
framework (LMF) —
Part 3:
Etymological extension
1 Scope
This document describes an extension to ISO 24613-1 and ISO 24613-2 to support the development of
detailed descriptions of common etymological phenomena and/or diachronic information with respect
to lexical entries in born-digital and/or retro-digitized lexicons. It provides both a meta-model for such
an extension as well as the relevant data categories.
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content
constitutes requirements of this document. For dated references, only the edition cited applies. For
undated references, the latest edition of the referenced document (including any amendments) applies.
ISO 8601-1, Date and time — Representations for information interchange — Part 1: Basic rules
ISO 8601-2, Date and time — Representations for information interchange — Part 2: Extensions
ISO 24613-1, Language resource management — Lexical markup framework (LMF) — Part 1: Core model
ISO 24613-2, Language resource management — Lexical markup framework (LMF) — Part 2: Machine-
readable dictionary (MRD) model
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 24613-1 and the following apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at http:// www .electropedia .org/
3.1
cognate
form in a related language which shares a common etymological origin as a form in the language of
the lexicon
3.2
etymologizable
meeting the conditions for having an etymology (3.3)
Note 1 to entry: "Etymologizable" is a category of lexical elements and usages (encompassing for instance lexical
entries, senses, word forms).
3.3
etymology
origin and historical development of any aspect of a given lexical item
3.4
etymon
lexical entry from which another lexical entry is derived
Note 1 to entry: An etymon can also be simply an earlier stage of a lexical item.
3.5
onomasiology
approach to the investigation of word meaning which takes a given concept as a starting point and
studies the different lexical items in a language or languages that are used to refer to it
4 The LMF etymology extension
NOTE See Annex A for examples of possible etymological typologies.
4.1 The Cognate class and the Etymon class
Cognate and Etymon are defined as subclasses of the LexicalEntry class from the LMF core module (see
2)
Figure 1) . Both classes define lexical entries which have been added to a lexical resource with the
purpose of describing the etymologies of one or more other lexical entries. Instances of either Etymon
or Cognate can be assigned a language which is different from the language of the lexicon as a whole
(this is specified in the LexiconInformation class as described in ISO 24613-1).
Figure 1 — Cognate and Etymon as subclasses of LexicalEntry
Individuals of both the Etymon and the Cognate classes shall be in an aggregation relationship with at
least one individual of type EtyLink (see 4.3). When describing etymologies, there are cases in which it
is necessary to deal with instances of LexicalEntry (and hence also by the subclass relation instances
of Etymon and Cognate) which are roots, and in particular reconstructed roots. In these cases, the fact
of being a root and the type of the root in question shall be specified using the attribute rootType.
In the case of reconstructed roots or other word forms, the attribute status serves to associate the
element with a written description of the likelihood of its having been in use (see the example in A.8).
See Table 1 for a list of attributes to be used with these two classes.
4.2 The Etymologizable class
The Etymologizable class provides a means of referring to the set of linguistic elements that can have
etymologies. By defining a single class encompassing all such ‘etymologizable’ elements, the classes
of elements which can have etymologies can be easily extended in the future wherever the necessity
arises. The following classes are subtypes of the Etymologizable class (see Figure 2): LexicalEntry,
Sense, Form and CognateSet (see 4.4).
2) In this document, the following colour scheme is used in diagrams: classes in yellow are introduced in this
document, and classes in pink have been previously introduced in ISO 24613-1 and ISO 24613-2.
2 © ISO 2021 – All rights reserved

Figure 2 — The Etymologizable class and its subclasses
4.3 The Etymology class and the EtyLink class
The Etymology class allows for the description of the etymology of a linguistic element. More specifically,
it allows for the description of those linguistic elements that are subclasses of the Etymologizable class.
The type or types of etymological process involved in a given etymology can be specified using the type
attribute, and also potentially the subtype attribute (in the case when the type of the etymology can be
further specified). Possible values for type and subtype can vary according to the theoretical approach
adopted by the compiler of a resource and/or the linguistic or editorial focus of the resource. The use of
nested Etymology instances allows a combination of etymological processes to be described. Examples
of etymological processes that shall be used as values for type/subtype: borrowing, inheritance; word
formation: compounding, derivation; sense shifts: narrowing, widening, amelioration, pejoration, metaphor,
metonymy; phonetic/phonological processes: place assimilation, dissimilation, epenthesis, metathesis,
hardening, weakening, etc. The list of data categories provided in Annex B shall be used in complement
to the appropriate classes. Individual links between two elements in an etymology can also be given
a type, see the description of EtyLink below. Given that an Etymology instance can be taken from
an external source, it can be associated with a Bibliography instance, which shall be defined as per
ISO 24613-2 (see Figure 3).
Figure 3 — The Etymology class
Instances of Etymology are associated with one or more EtyLink instances, each of which represents a
single stage or step in the etymology of a given lexical item (see Figure 4). EtyLink serves to link together
individuals belonging to the subclasses of Etymologizable. EtyLink is a subclass of the CrossREF class
as defined in ISO 24613-1. The use of CrossREF requires that the target objects representing the given
lexical content be given id attributes. The use of the id attribute on an individual of the Etymologizable
class as a target allows for t
...


INTERNATIONAL ISO
STANDARD 24613-3
First edition
2021-03
Language resource management —
Lexical markup framework (LMF) —
Part 3:
Etymological extension
Gestion des ressources linguistiques — Cadre de balisage lexical
(LMF) —
Partie 3: Extension étymologique
Reference number
©
ISO 2021
© ISO 2021
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting
on the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address
below or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii © ISO 2021 – All rights reserved

Contents Page
Foreword .iv
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 The LMF etymology extension . 2
4.1 The Cognate class and the Etymon class . 2
4.2 The Etymologizable class . 2
4.3 The Etymology class and the EtyLink class . 3
4.4 The CognateSet class . 4
4.5 The Date class . 4
4.6 The Gloss class. 4
Annex A (informative) Examples of possible etymological typologies . 6
Annex B (normative) Data categories for etymology description .15
Bibliography .22
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out
through ISO technical committees. Each member body interested in a subject for which a technical
committee has been established has the right to be represented on that committee. International
organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.
ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of
electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are
described in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the
different types of ISO documents should be noted. This document was drafted in accordance with the
editorial rules of the ISO/IEC Directives, Part 2 (see www .iso .org/ directives).
Attention is drawn to the possibility that some of the elements of this document may be the subject of
patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of
any patent rights identified during the development of the document will be in the Introduction and/or
on the ISO list of patent declarations received (see www .iso .org/ patents).
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and
expressions related to conformity assessment, as well as information about ISO's adherence to the
World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see www .iso .org/
iso/ foreword .html.
This document was prepared by Technical Committee ISO/TC 37, Language and terminology,
Subcommittee SC 4, Language resource management.
This first edition of ISO 24613-3, together with ISO 24613-1:2019, ISO 24613-2:2020, ISO 24613-4:2021
1)
and ISO 24613-5:— , cancels and replaces ISO 24613:2008, which has been technically revised.
The main changes compared to the previous edition are as follows:
— entire revision of the content and its subdivision into several parts.
A list of all parts in the ISO 24613 series can be found on the ISO website.
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www .iso .org/ members .html.
1) Under preparation. Stage at the time of publication: ISO/DIS 24613-5:2020.
iv © ISO 2021 – All rights reserved

INTERNATIONAL STANDARD ISO 24613-3:2021(E)
Language resource management — Lexical markup
framework (LMF) —
Part 3:
Etymological extension
1 Scope
This document describes an extension to ISO 24613-1 and ISO 24613-2 to support the development of
detailed descriptions of common etymological phenomena and/or diachronic information with respect
to lexical entries in born-digital and/or retro-digitized lexicons. It provides both a meta-model for such
an extension as well as the relevant data categories.
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content
constitutes requirements of this document. For dated references, only the edition cited applies. For
undated references, the latest edition of the referenced document (including any amendments) applies.
ISO 8601-1, Date and time — Representations for information interchange — Part 1: Basic rules
ISO 8601-2, Date and time — Representations for information interchange — Part 2: Extensions
ISO 24613-1, Language resource management — Lexical markup framework (LMF) — Part 1: Core model
ISO 24613-2, Language resource management — Lexical markup framework (LMF) — Part 2: Machine-
readable dictionary (MRD) model
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 24613-1 and the following apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at http:// www .electropedia .org/
3.1
cognate
form in a related language which shares a common etymological origin as a form in the language of
the lexicon
3.2
etymologizable
meeting the conditions for having an etymology (3.3)
Note 1 to entry: "Etymologizable" is a category of lexical elements and usages (encompassing for instance lexical
entries, senses, word forms).
3.3
etymology
origin and historical development of any aspect of a given lexical item
3.4
etymon
lexical entry from which another lexical entry is derived
Note 1 to entry: An etymon can also be simply an earlier stage of a lexical item.
3.5
onomasiology
approach to the investigation of word meaning which takes a given concept as a starting point and
studies the different lexical items in a language or languages that are used to refer to it
4 The LMF etymology extension
NOTE See Annex A for examples of possible etymological typologies.
4.1 The Cognate class and the Etymon class
Cognate and Etymon are defined as subclasses of the LexicalEntry class from the LMF core module (see
2)
Figure 1) . Both classes define lexical entries which have been added to a lexical resource with the
purpose of describing the etymologies of one or more other lexical entries. Instances of either Etymon
or Cognate can be assigned a language which is different from the language of the lexicon as a whole
(this is specified in the LexiconInformation class as described in ISO 24613-1).
Figure 1 — Cognate and Etymon as subclasses of LexicalEntry
Individuals of both the Etymon and the Cognate classes shall be in an aggregation relationship with at
least one individual of type EtyLink (see 4.3). When describing etymologies, there are cases in which it
is necessary to deal with instances of LexicalEntry (and hence also by the subclass relation instances
of Etymon and Cognate) which are roots, and in particular reconstructed roots. In these cases, the fact
of being a root and the type of the root in question shall be specified using the attribute rootType.
In the case of reconstructed roots or other word forms, the attribute status serves to associate the
element with a written description of the likelihood of its having been in use (see the example in A.8).
See Table 1 for a list of attributes to be used with these two classes.
4.2 The Etymologizable class
The Etymologizable class provides a means of referring to the set of linguistic elements that can have
etymologies. By defining a single class encompassing all such ‘etymologizable’ elements, the classes
of elements which can have etymologies can be easily extended in the future wherever the necessity
arises. The following classes are subtypes of the Etymologizable class (see Figure 2): LexicalEntry,
Sense, Form and CognateSet (see 4.4).
2) In this document, the following colour scheme is used in diagrams: classes in yellow are introduced in this
document, and classes in pink have been previously introduced in ISO 24613-1 and ISO 24613-2.
2 © ISO 2021 – All rights reserved

Figure 2 — The Etymologizable class and its subclasses
4.3 The Etymology class and the EtyLink class
The Etymology class allows for the description of the etymology of a linguistic element. More specifically,
it allows for the description of those linguistic elements that are subclasses of the Etymologizable class.
The type or types of etymological process involved in a given etymology can be specified using the type
attribute, and also potentially the subtype attribute (in the case when the type of the etymology can be
further specified). Possible values for type and subtype can vary according to the theoretical approach
adopted by the compiler of a resource and/or the linguistic or editorial focus of the resource. The use of
nested Etymology instances allows a combination of etymological processes to be described. Examples
of etymological processes that shall be used as values for type/subtype: borrowing, inheritance; word
formation: compounding, derivation; sense shifts: narrowing, widening, amelioration, pejoration, metaphor,
metonymy; phonetic/phonological processes: place assimilation, dissimilation, epenthesis, metathesis,
hardening, weakening, etc. The list of data categories provided in Annex B shall be used in complement
to the appropriate classes. Individual links between two elements in an etymology can also be given
a type, see the description of EtyLink below. Given that an Etymology instance can be taken from
an external source, it can be associated with a Bibliography instance, which shall be defined as per
ISO 24613-2 (see Figure 3).
Figure 3 — The Etymology class
Instances of Etymology are associated with one or more EtyLink instances, each of which represents a
single stage or step in the etymology of a given lexical item (see Figure 4). EtyLink serves to link together
individuals belonging to the subclasses of Etymologizable. EtyLink is a subclass of the CrossREF class
as defined in ISO 24613-1. The use of CrossREF requires that the target objects representing the given
lexical content be given id attributes. The use of the id attribute on an individual of the Etymologizable
class as a target allows for the modelling of a generic sequential temporal ordering of multiple elements,
using the attributes prev and next. Instances of the EtyLink class can further specify additional
temporal relationships using various temporal attributes associated with the source and target of each
EtyLink instance.
Figure 4 — EtyLink
Individuals of the Etymon and Cognate classes (subtypes of LexicalEntry) shall be associated with at
least one individual of EtyLink. See Table 1 for a list of attributes to be used with the Etymology and
EtyLink classes.
4.4 The CognateSet class
The CognateSet class (see Figure 5) is a container for sets of one or more Cognate items and zero or
more Bibliography items (see ISO 24613-2). The CognateSet is a construct related to onomasiology. Its
contents are items from languages related to that of a given LexicalEntry (and therefore by the subclass
relation of any given Etymon or Cognate) and which have been gathered together with the purpose
of demonstrating linguistic similarities or dissimilarities of salient ki
...


INTERNATIONAL ISO
STANDARD 24613-3
First edition
2021-03
Language resource management —
Lexical markup framework (LMF) —
Part 3:
Etymological extension
Gestion des ressources linguistiques — Cadre de balisage lexical
(LMF) —
Partie 3: Extension étymologique
Reference number
©
ISO 2021
© ISO 2021
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting
on the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address
below or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii © ISO 2021 – All rights reserved

Contents Page
Foreword .iv
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 The LMF etymology extension . 2
4.1 The Cognate class and the Etymon class . 2
4.2 The Etymologizable class . 2
4.3 The Etymology class and the EtyLink class . 3
4.4 The CognateSet class . 4
4.5 The Date class . 4
4.6 The Gloss class. 4
Annex A (informative) Examples of possible etymological typologies . 6
Annex B (normative) Data categories for etymology description .15
Bibliography .22
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out
through ISO technical committees. Each member body interested in a subject for which a technical
committee has been established has the right to be represented on that committee. International
organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.
ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of
electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are
described in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the
different types of ISO documents should be noted. This document was drafted in accordance with the
editorial rules of the ISO/IEC Directives, Part 2 (see www .iso .org/ directives).
Attention is drawn to the possibility that some of the elements of this document may be the subject of
patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of
any patent rights identified during the development of the document will be in the Introduction and/or
on the ISO list of patent declarations received (see www .iso .org/ patents).
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and
expressions related to conformity assessment, as well as information about ISO's adherence to the
World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see www .iso .org/
iso/ foreword .html.
This document was prepared by Technical Committee ISO/TC 37, Language and terminology,
Subcommittee SC 4, Language resource management.
This first edition of ISO 24613-3, together with ISO 24613-1:2019, ISO 24613-2:2020, ISO 24613-4:2021
1)
and ISO 24613-5:— , cancels and replaces ISO 24613:2008, which has been technically revised.
The main changes compared to the previous edition are as follows:
— entire revision of the content and its subdivision into several parts.
A list of all parts in the ISO 24613 series can be found on the ISO website.
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www .iso .org/ members .html.
1) Under preparation. Stage at the time of publication: ISO/DIS 24613-5:2020.
iv © ISO 2021 – All rights reserved

INTERNATIONAL STANDARD ISO 24613-3:2021(E)
Language resource management — Lexical markup
framework (LMF) —
Part 3:
Etymological extension
1 Scope
This document describes an extension to ISO 24613-1 and ISO 24613-2 to support the development of
detailed descriptions of common etymological phenomena and/or diachronic information with respect
to lexical entries in born-digital and/or retro-digitized lexicons. It provides both a meta-model for such
an extension as well as the relevant data categories.
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content
constitutes requirements of this document. For dated references, only the edition cited applies. For
undated references, the latest edition of the referenced document (including any amendments) applies.
ISO 8601-1, Date and time — Representations for information interchange — Part 1: Basic rules
ISO 8601-2, Date and time — Representations for information interchange — Part 2: Extensions
ISO 24613-1, Language resource management — Lexical markup framework (LMF) — Part 1: Core model
ISO 24613-2, Language resource management — Lexical markup framework (LMF) — Part 2: Machine-
readable dictionary (MRD) model
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 24613-1 and the following apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at http:// www .electropedia .org/
3.1
cognate
form in a related language which shares a common etymological origin as a form in the language of
the lexicon
3.2
etymologizable
meeting the conditions for having an etymology (3.3)
Note 1 to entry: "Etymologizable" is a category of lexical elements and usages (encompassing for instance lexical
entries, senses, word forms).
3.3
etymology
origin and historical development of any aspect of a given lexical item
3.4
etymon
lexical entry from which another lexical entry is derived
Note 1 to entry: An etymon can also be simply an earlier stage of a lexical item.
3.5
onomasiology
approach to the investigation of word meaning which takes a given concept as a starting point and
studies the different lexical items in a language or languages that are used to refer to it
4 The LMF etymology extension
NOTE See Annex A for examples of possible etymological typologies.
4.1 The Cognate class and the Etymon class
Cognate and Etymon are defined as subclasses of the LexicalEntry class from the LMF core module (see
2)
Figure 1) . Both classes define lexical entries which have been added to a lexical resource with the
purpose of describing the etymologies of one or more other lexical entries. Instances of either Etymon
or Cognate can be assigned a language which is different from the language of the lexicon as a whole
(this is specified in the LexiconInformation class as described in ISO 24613-1).
Figure 1 — Cognate and Etymon as subclasses of LexicalEntry
Individuals of both the Etymon and the Cognate classes shall be in an aggregation relationship with at
least one individual of type EtyLink (see 4.3). When describing etymologies, there are cases in which it
is necessary to deal with instances of LexicalEntry (and hence also by the subclass relation instances
of Etymon and Cognate) which are roots, and in particular reconstructed roots. In these cases, the fact
of being a root and the type of the root in question shall be specified using the attribute rootType.
In the case of reconstructed roots or other word forms, the attribute status serves to associate the
element with a written description of the likelihood of its having been in use (see the example in A.8).
See Table 1 for a list of attributes to be used with these two classes.
4.2 The Etymologizable class
The Etymologizable class provides a means of referring to the set of linguistic elements that can have
etymologies. By defining a single class encompassing all such ‘etymologizable’ elements, the classes
of elements which can have etymologies can be easily extended in the future wherever the necessity
arises. The following classes are subtypes of the Etymologizable class (see Figure 2): LexicalEntry,
Sense, Form and CognateSet (see 4.4).
2) In this document, the following colour scheme is used in diagrams: classes in yellow are introduced in this
document, and classes in pink have been previously introduced in ISO 24613-1 and ISO 24613-2.
2 © ISO 2021 – All rights reserved

Figure 2 — The Etymologizable class and its subclasses
4.3 The Etymology class and the EtyLink class
The Etymology class allows for the description of the etymology of a linguistic element. More specifically,
it allows for the description of those linguistic elements that are subclasses of the Etymologizable class.
The type or types of etymological process involved in a given etymology can be specified using the type
attribute, and also potentially the subtype attribute (in the case when the type of the etymology can be
further specified). Possible values for type and subtype can vary according to the theoretical approach
adopted by the compiler of a resource and/or the linguistic or editorial focus of the resource. The use of
nested Etymology instances allows a combination of etymological processes to be described. Examples
of etymological processes that shall be used as values for type/subtype: borrowing, inheritance; word
formation: compounding, derivation; sense shifts: narrowing, widening, amelioration, pejoration, metaphor,
metonymy; phonetic/phonological processes: place assimilation, dissimilation, epenthesis, metathesis,
hardening, weakening, etc. The list of data categories provided in Annex B shall be used in complement
to the appropriate classes. Individual links between two elements in an etymology can also be given
a type, see the description of EtyLink below. Given that an Etymology instance can be taken from
an external source, it can be associated with a Bibliography instance, which shall be defined as per
ISO 24613-2 (see Figure 3).
Figure 3 — The Etymology class
Instances of Etymology are associated with one or more EtyLink instances, each of which represents a
single stage or step in the etymology of a given lexical item (see Figure 4). EtyLink serves to link together
individuals belonging to the subclasses of Etymologizable. EtyLink is a subclass of the CrossREF class
as defined in ISO 24613-1. The use of CrossREF requires that the target objects representing the given
lexical content be given id attributes. The use of the id attribute on an individual of the Etymologizable
class as a target allows for the modelling of a generic sequential temporal ordering of multiple elements,
using the attributes prev and next. Instances of the EtyLink class can further specify additional
temporal relationships using various temporal attributes associated with the source and target of each
EtyLink instance.
Figure 4 — EtyLink
Individuals of the Etymon and Cognate classes (subtypes of LexicalEntry) shall be associated with at
least one individual of EtyLink. See Table 1 for a list of attributes to be used with the Etymology and
EtyLink classes.
4.4 The CognateSet class
The CognateSet class (see Figure 5) is a container for sets of one or more Cognate items and zero or
more Bibliography items (see ISO 24613-2). The CognateSet is a construct related to onomasiology. Its
contents are items from languages related to that of a given LexicalEntry (and therefore by the subclass
relation of any given Etymon or Cognate) and which have been gathered together with the purpose
of demonstrating linguistic similarities or dissimilarities of salient ki
...


NORME ISO
INTERNATIONALE 24613-3
Première édition
2021-03
Gestion des ressources
linguistiques — Cadre de balisage
lexical (LMF) —
Partie 3:
Extension étymologique
Language resource management — Lexical markup framework
(LMF) —
Part 3: Etymological extension
Numéro de référence
©
ISO 2021
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2021
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette
publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,
y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut
être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse
ii © ISO 2021 – Tous droits réservés

Sommaire Page
Avant-propos .iv
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Extension étymologique de LMF . 2
4.1 Classes Cognate et Etymon . 2
4.2 Classe Etymologizable . 2
4.3 Classes Etymology et EtyLink . 3
4.4 Classe CognateSet . 4
4.5 Classe Date . 4
4.6 Classe Gloss . 4
Annexe A (informative) Exemples de typologies étymologiques possibles . 6
Annexe B (normative) Catégories de données pour la description étymologique .15
Bibliographie .22
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes
nationaux de normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est
en général confiée aux comités techniques de l’ISO. Chaque comité membre intéressé par une étude
a le droit de faire partie du comité technique créé à cet effet. Les organisations internationales,
gouvernementales et non gouvernementales, en liaison avec l’ISO participent également aux travaux.
L’ISO collabore étroitement avec la Commission électrotechnique internationale (IEC) en ce qui
concerne la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont
décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier de prendre note des différents
critères d’approbation requis pour les différents types de documents ISO. Le présent document a été
rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www
.iso .org/ directives).
L’attention est attirée sur le fait que certains des éléments du présent document peuvent faire l’objet de
droits de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable
de ne pas avoir identifié de tels droits de propriété et averti de leur existence. Les détails concernant
les références aux droits de propriété intellectuelle ou autres droits analogues identifiés lors de
l’élaboration du document sont indiqués dans l’Introduction et/ou dans la liste des déclarations de
brevets reçues par l’ISO (voir www .iso .org/ brevets).
Les appellations commerciales éventuellement mentionnées dans le présent document sont données
pour information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un
engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions
spécifiques de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion
de l’ISO aux principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles
techniques au commerce (OTC), voir le lien suivant: www .iso .org/ iso/ fr/ avant -propos.
Le présent document a été élaboré par le comité technique ISO/TC 37, Langage et terminologie, sous-
comité SC 4, Gestion des ressources linguistiques.
Cette première édition de l’ISO 24613-3, conjointement avec l'ISO 24613-1:2019, l'ISO 24613-2:2020,
1)
l'ISO 24613-4:2021 et l'ISO 24613-5:— , annule et remplace l’ISO 24613:2008, qui a fait l’objet d’une
révision technique.
Les principales modifications par rapport à l’édition précédente sont les suivantes:
— révision complète du contenu et de sa subdivision en plusieurs parties.
Une liste de toutes les parties de la série ISO 24613 se trouve sur le site web de l’ISO.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes
se trouve à l’adresse www .iso .org/ fr/ members .html.
1) En cours d’élaboration. Stade au moment de la publication: ISO/DIS 24613-5:2020.
iv © ISO 2021 – Tous droits réservés

NORME INTERNATIONALE ISO 24613-3:2021(F)
Gestion des ressources linguistiques — Cadre de balisage
lexical (LMF) —
Partie 3:
Extension étymologique
1 Domaine d’application
Le présent document décrit une extension de l’ISO 24613-1 et de l’ISO 24613-2 et facilite l’élaboration
des descriptions détaillées de phénomènes étymologiques courants et/ou d’informations diachroniques
par rapport aux entrées lexicales des lexiques numériques et/ou rétronumérisés. Il fournit à la fois un
métamodèle pour une extension de ce type ainsi que les catégories de données pertinentes.
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur
contenu, des exigences du présent document. Pour les références datées, seule l’édition citée s’applique.
Pour les références non datées, la dernière édition du document de référence s’applique (y compris les
éventuels amendements).
ISO 8601-1, Date et heure — Représentations pour l'échange d'information — Partie 1: Règles de base
ISO 8601-2, Date et heure — Représentations pour l'échange d'information — Partie 2: Extensions
ISO 24613-1, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 1:
Modèle de base
ISO 24613-2, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 2: Modèle de
dictionnaire lisible par ordinateur (MRD)
3 Termes et définitions
Pour les besoins du présent document, les termes et définitions de l’ISO 24613-1 ainsi que les suivants,
s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en
normalisation, consultables aux adresses suivantes:
— ISO Online browsing platform: disponible à l’adresse https:// www .iso .org/ obp;
— IEC Electropedia: disponible à l’adresse http:// www .electropedia .org/ .
3.1
cognat
dans une langue apparentée, forme qui partage une origine étymologique commune avec une forme
dans la langue du lexique
3.2
étymologisable
qui remplit les conditions requises pour avoir une étymologie (3.3)
Note 1 à l'article: Le terme «étymologisable» se rapporte à une catégorie d’éléments et d’usages lexicaux
(englobant par exemple des entrées lexicales, des sens et des mots-formes).
3.3
étymologie
origine et développement historique de tout aspect d’un élément lexical donné
3.4
étymon
entrée lexicale dont découle une autre entrée lexicale
Note 1 à l'article: Un étymon peut également être une phase antérieure d’un élément lexical.
3.5
onomasiologie
étude sémantique des mots qui, en partant d’un concept donné, examine les différents éléments lexicaux
utilisés dans une ou plusieurs langues pour se référer à ce concept
4 Extension étymologique de LMF
NOTE Voir l’Annexe A pour obtenir des exemples de typologies étymologiques possibles.
4.1 Classes Cognate et Etymon
Cognate et Etymon sont définies comme des sous-classes de la classe LexicalEntry du module de base
2)
LMF (voir Figure 1) . Les deux classes définissent des entrées lexicales qui ont été ajoutées à une
ressource lexicale dans le but de décrire les étymologies d’une ou plusieurs autres entrées lexicales. Aux
instances Etymon ou Cognate peut être assignée une langue qui est différente de celle du lexique dans
son ensemble (cette langue est spécifiée dans la classe LexiconInformation décrite dans l’ISO 24613-1).
Figure 1 — Sous-classes Cognate et Etymon de la classe LexicalEntry
Les individus des sous-classes Etymon et Cognate doivent être en relation d’agrégation avec au moins
un individu de type EtyLink (voir 4.3). Lors de la description des étymologies, il est nécessaire de traiter,
dans certains cas, des instances LexicalEntry (et, de ce fait, également des instances de relation de
sous-classe d’Etymon et de Cognate) qui sont des radicaux, et en particulier des radicaux reconstruits.
Dans ces cas, le fait d’être un radical et le type du radical en question doivent être spécifiés en utilisant
l’attribut rootType. Dans le cas de radicaux reconstruits ou d’autres mots-formes, l’attribut status sert
à associer l’élément à une description écrite de sa probabilité d’avoir été utilisé (voir l’exemple de A.8).
Voir le Tableau 1 pour obtenir une liste d’attributs à utiliser avec ces deux sous-classes.
4.2 Classe Etymologizable
La classe Etymologizable permet de désigner l’ensemble des éléments linguistiques qui peuvent avoir
des étymologies. En définissant une seule classe englobant tous les éléments «étymologisables» de
ce type, les classes d’éléments qui peuvent avoir des étymologies pourront être facilement étendues
en fonction des besoins. Les classes suivantes sont des sous-types de la classe Etymologizable (voir
Figure 2): LexicalEntry, Sense, Form et CognateSet (voir 4.4).
2) Les schémas du présent document utilisent les codes de couleurs suivants : les classes en jaune sont
introduites dans le présent document, alors que les classes en rose l’avaient été précédemment dans l’ISO 24613-1
et l’ISO 24613-2.
2 © ISO 2021 – Tous droits réservés

Figure 2 — Classe Etymologizable et ses sous-classes
4.3 Classes Etymology et EtyLink
La classe Etymology permet de décrire l’étymologie d’un élément linguistique. Plus spécifiquement,
elle permet de décrire les éléments linguistiques qui sont des sous-classes de la classe Etymologizable.
Le type ou les types de processus étymologique impliqués dans une étymologie donnée peuvent être
spécifiés en utilisant l’attribut type, et aussi potentiellement l’attribut subtype (si le type de l’étymologie
peut également être précisé). Les valeurs possibles pour les attributs type et subtype peuvent varier
en fonction de l’approche théorique adoptée par le compilateur d’une ressource et/ou de l’orientation
linguistique ou éditoriale de la ressource en question. L’imbrication des instances Etymology permet de
combiner les processus étymologiques à décrire. Les processus étymologiques qui doivent être utilisés
comme valeurs pour les attributs type/subtype peuvent par exemple être: emprunt, héritage; formation
des mots: mots composés, dérivation; glissements de sens: restriction, élargissement, amélioration,
péjoration, métaphore, métonymie; processus phonétiques/phonologiques: assimilation, dissimilation,
épenthèse, métathèse, durcissement, affaiblissement, etc. La liste des catégories de données fournie
à l’Annexe B doit être utilisée en complément des classes appropriées. Un type peut également être
spécifié pour des liens individuels entre deux éléments au sein d’une étymologie (voir la description
d’EtyLink ci-dessous). Comme une instance Etymology peut être extraite d’une source externe, elle
peut être associée à une instance Bibliography, qui doit être définie conformément à l’ISO 24613-2 (voir
Figure 3).
Figure 3 — Classe Etymology
Les instances Etymology sont associées à une ou plusieurs instances EtyLink, chacune d’elles
représentant une seule phase ou étape dans l’étymologie d’un élément lexical donné (voir Figure 4).
EtyLink sert à rattacher des individus appartenant aux sous-classes Etymologizable. EtyLink est une
sous-classe de la classe CrossREF définie dans l’ISO 24613-1. L’utilisation de CrossREF impose d’affecter
des attributs id aux objets cibles représentant le contenu lexical spécifique. L’utilisation de l’attribut
id, en tant que cible, sur un individu de la class
...


NORME ISO
INTERNATIONALE 24613-3
Première édition
2021-03
Gestion des ressources
linguistiques — Cadre de balisage
lexical (LMF) —
Partie 3:
Extension étymologique
Language resource management — Lexical markup framework
(LMF) —
Part 3: Etymological extension
Numéro de référence
©
ISO 2021
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2021
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette
publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,
y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut
être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse
ii © ISO 2021 – Tous droits réservés

Sommaire Page
Avant-propos .iv
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Extension étymologique de LMF . 2
4.1 Classes Cognate et Etymon . 2
4.2 Classe Etymologizable . 2
4.3 Classes Etymology et EtyLink . 3
4.4 Classe CognateSet . 4
4.5 Classe Date . 4
4.6 Classe Gloss . 4
Annexe A (informative) Exemples de typologies étymologiques possibles . 6
Annexe B (normative) Catégories de données pour la description étymologique .15
Bibliographie .22
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes
nationaux de normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est
en général confiée aux comités techniques de l’ISO. Chaque comité membre intéressé par une étude
a le droit de faire partie du comité technique créé à cet effet. Les organisations internationales,
gouvernementales et non gouvernementales, en liaison avec l’ISO participent également aux travaux.
L’ISO collabore étroitement avec la Commission électrotechnique internationale (IEC) en ce qui
concerne la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont
décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier de prendre note des différents
critères d’approbation requis pour les différents types de documents ISO. Le présent document a été
rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www
.iso .org/ directives).
L’attention est attirée sur le fait que certains des éléments du présent document peuvent faire l’objet de
droits de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable
de ne pas avoir identifié de tels droits de propriété et averti de leur existence. Les détails concernant
les références aux droits de propriété intellectuelle ou autres droits analogues identifiés lors de
l’élaboration du document sont indiqués dans l’Introduction et/ou dans la liste des déclarations de
brevets reçues par l’ISO (voir www .iso .org/ brevets).
Les appellations commerciales éventuellement mentionnées dans le présent document sont données
pour information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un
engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions
spécifiques de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion
de l’ISO aux principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles
techniques au commerce (OTC), voir le lien suivant: www .iso .org/ iso/ fr/ avant -propos.
Le présent document a été élaboré par le comité technique ISO/TC 37, Langage et terminologie, sous-
comité SC 4, Gestion des ressources linguistiques.
Cette première édition de l’ISO 24613-3, conjointement avec l'ISO 24613-1:2019, l'ISO 24613-2:2020,
1)
l'ISO 24613-4:2021 et l'ISO 24613-5:— , annule et remplace l’ISO 24613:2008, qui a fait l’objet d’une
révision technique.
Les principales modifications par rapport à l’édition précédente sont les suivantes:
— révision complète du contenu et de sa subdivision en plusieurs parties.
Une liste de toutes les parties de la série ISO 24613 se trouve sur le site web de l’ISO.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes
se trouve à l’adresse www .iso .org/ fr/ members .html.
1) En cours d’élaboration. Stade au moment de la publication: ISO/DIS 24613-5:2020.
iv © ISO 2021 – Tous droits réservés

NORME INTERNATIONALE ISO 24613-3:2021(F)
Gestion des ressources linguistiques — Cadre de balisage
lexical (LMF) —
Partie 3:
Extension étymologique
1 Domaine d’application
Le présent document décrit une extension de l’ISO 24613-1 et de l’ISO 24613-2 et facilite l’élaboration
des descriptions détaillées de phénomènes étymologiques courants et/ou d’informations diachroniques
par rapport aux entrées lexicales des lexiques numériques et/ou rétronumérisés. Il fournit à la fois un
métamodèle pour une extension de ce type ainsi que les catégories de données pertinentes.
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur
contenu, des exigences du présent document. Pour les références datées, seule l’édition citée s’applique.
Pour les références non datées, la dernière édition du document de référence s’applique (y compris les
éventuels amendements).
ISO 8601-1, Date et heure — Représentations pour l'échange d'information — Partie 1: Règles de base
ISO 8601-2, Date et heure — Représentations pour l'échange d'information — Partie 2: Extensions
ISO 24613-1, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 1:
Modèle de base
ISO 24613-2, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 2: Modèle de
dictionnaire lisible par ordinateur (MRD)
3 Termes et définitions
Pour les besoins du présent document, les termes et définitions de l’ISO 24613-1 ainsi que les suivants,
s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en
normalisation, consultables aux adresses suivantes:
— ISO Online browsing platform: disponible à l’adresse https:// www .iso .org/ obp;
— IEC Electropedia: disponible à l’adresse http:// www .electropedia .org/ .
3.1
cognat
dans une langue apparentée, forme qui partage une origine étymologique commune avec une forme
dans la langue du lexique
3.2
étymologisable
qui remplit les conditions requises pour avoir une étymologie (3.3)
Note 1 à l'article: Le terme «étymologisable» se rapporte à une catégorie d’éléments et d’usages lexicaux
(englobant par exemple des entrées lexicales, des sens et des mots-formes).
3.3
étymologie
origine et développement historique de tout aspect d’un élément lexical donné
3.4
étymon
entrée lexicale dont découle une autre entrée lexicale
Note 1 à l'article: Un étymon peut également être une phase antérieure d’un élément lexical.
3.5
onomasiologie
étude sémantique des mots qui, en partant d’un concept donné, examine les différents éléments lexicaux
utilisés dans une ou plusieurs langues pour se référer à ce concept
4 Extension étymologique de LMF
NOTE Voir l’Annexe A pour obtenir des exemples de typologies étymologiques possibles.
4.1 Classes Cognate et Etymon
Cognate et Etymon sont définies comme des sous-classes de la classe LexicalEntry du module de base
2)
LMF (voir Figure 1) . Les deux classes définissent des entrées lexicales qui ont été ajoutées à une
ressource lexicale dans le but de décrire les étymologies d’une ou plusieurs autres entrées lexicales. Aux
instances Etymon ou Cognate peut être assignée une langue qui est différente de celle du lexique dans
son ensemble (cette langue est spécifiée dans la classe LexiconInformation décrite dans l’ISO 24613-1).
Figure 1 — Sous-classes Cognate et Etymon de la classe LexicalEntry
Les individus des sous-classes Etymon et Cognate doivent être en relation d’agrégation avec au moins
un individu de type EtyLink (voir 4.3). Lors de la description des étymologies, il est nécessaire de traiter,
dans certains cas, des instances LexicalEntry (et, de ce fait, également des instances de relation de
sous-classe d’Etymon et de Cognate) qui sont des radicaux, et en particulier des radicaux reconstruits.
Dans ces cas, le fait d’être un radical et le type du radical en question doivent être spécifiés en utilisant
l’attribut rootType. Dans le cas de radicaux reconstruits ou d’autres mots-formes, l’attribut status sert
à associer l’élément à une description écrite de sa probabilité d’avoir été utilisé (voir l’exemple de A.8).
Voir le Tableau 1 pour obtenir une liste d’attributs à utiliser avec ces deux sous-classes.
4.2 Classe Etymologizable
La classe Etymologizable permet de désigner l’ensemble des éléments linguistiques qui peuvent avoir
des étymologies. En définissant une seule classe englobant tous les éléments «étymologisables» de
ce type, les classes d’éléments qui peuvent avoir des étymologies pourront être facilement étendues
en fonction des besoins. Les classes suivantes sont des sous-types de la classe Etymologizable (voir
Figure 2): LexicalEntry, Sense, Form et CognateSet (voir 4.4).
2) Les schémas du présent document utilisent les codes de couleurs suivants : les classes en jaune sont
introduites dans le présent document, alors que les classes en rose l’avaient été précédemment dans l’ISO 24613-1
et l’ISO 24613-2.
2 © ISO 2021 – Tous droits réservés

Figure 2 — Classe Etymologizable et ses sous-classes
4.3 Classes Etymology et EtyLink
La classe Etymology permet de décrire l’étymologie d’un élément linguistique. Plus spécifiquement,
elle permet de décrire les éléments linguistiques qui sont des sous-classes de la classe Etymologizable.
Le type ou les types de processus étymologique impliqués dans une étymologie donnée peuvent être
spécifiés en utilisant l’attribut type, et aussi potentiellement l’attribut subtype (si le type de l’étymologie
peut également être précisé). Les valeurs possibles pour les attributs type et subtype peuvent varier
en fonction de l’approche théorique adoptée par le compilateur d’une ressource et/ou de l’orientation
linguistique ou éditoriale de la ressource en question. L’imbrication des instances Etymology permet de
combiner les processus étymologiques à décrire. Les processus étymologiques qui doivent être utilisés
comme valeurs pour les attributs type/subtype peuvent par exemple être: emprunt, héritage; formation
des mots: mots composés, dérivation; glissements de sens: restriction, élargissement, amélioration,
péjoration, métaphore, métonymie; processus phonétiques/phonologiques: assimilation, dissimilation,
épenthèse, métathèse, durcissement, affaiblissement, etc. La liste des catégories de données fournie
à l’Annexe B doit être utilisée en complément des classes appropriées. Un type peut également être
spécifié pour des liens individuels entre deux éléments au sein d’une étymologie (voir la description
d’EtyLink ci-dessous). Comme une instance Etymology peut être extraite d’une source externe, elle
peut être associée à une instance Bibliography, qui doit être définie conformément à l’ISO 24613-2 (voir
Figure 3).
Figure 3 — Classe Etymology
Les instances Etymology sont associées à une ou plusieurs instances EtyLink, chacune d’elles
représentant une seule phase ou étape dans l’étymologie d’un élément lexical donné (voir Figure 4).
EtyLink sert à rattacher des individus appartenant aux sous-classes Etymologizable. EtyLink est une
sous-classe de la classe CrossREF définie dans l’ISO 24613-1. L’utilisation de CrossREF impose d’affecter
des attributs id aux objets cibles représentant le contenu lexical spécifique. L’utilisation de l’attribut
id, en tant que cible, sur un individu de la class
...

Questions, Comments and Discussion

Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.