Refine
Year of publication
- 2023 (167) (remove)
Document Type
- Bachelor Thesis (52)
- Article (44)
- Conference Proceeding (30)
- Part of a Book (22)
- Book (7)
- Master's Thesis (2)
- Patent (2)
- Preprint (2)
- Contribution to a Periodical (1)
- Habilitation (1)
- Other (1)
- Part of Periodical (1)
- Report (1)
- Talk (1)
Has Fulltext
- no (167) (remove)
Keywords
- Editorial (5)
- Corporate Design (4)
- Design (3)
- Erscheinungsbild (3)
- Illustration (3)
- Nachhaltigkeit (3)
- Natural language processing (3)
- Publikation (3)
- Animation (2)
- Associated liquids (2)
- Diversity Management (2)
- Engineering Habitus (2)
- Future Skills (2)
- Industriedesign (2)
- Information extraction (2)
- Interdisciplinarity (2)
- Kommunikationsdesign (2)
- Museum (2)
- Organizational Culture (2)
- Power plants (2)
- Print (2)
- Produktdesign (2)
- Redesign (2)
- Sammlung (2)
- Sustainability (2)
- Typografie (2)
- ultrasound (2)
- (R)- or (S)- gamma-valerolactone (1)
- 2D (1)
- 4-hydroxy valeric acid (1)
- 60er Jahre (1)
- Abenteuer (1)
- Abgelegene Gebiete (1)
- Abstrahierung (1)
- Abstrakt (1)
- Academia (1)
- Active learning (1)
- Agent-based simulation (1)
- Agile development (1)
- Algen (1)
- Alternative Konsumoption (1)
- Android (1)
- Angststörungen (1)
- Anomaly detection (1)
- Antennen (1)
- Anti-Bias (1)
- Antibias (1)
- Arbeitsbekleidung (1)
- Architektur (1)
- Asymptotic relative efficiency (1)
- Atmen (1)
- Aufklärungskampagne (1)
- Ausstellungsdesign (1)
- Ausstellungskonzept (1)
- Automation (1)
- Automobil (1)
- BMW (1)
- Bacillus atrophaeus spores (1)
- Bahn (1)
- Bahnfahrt (1)
- Bambus (1)
- Barock (1)
- Benin Bronzen (1)
- Benutzerfreundlich (1)
- Best practice sharing (1)
- Bewegtbild (1)
- Bewegung (1)
- Bioenergiefassaden (1)
- Blindenstock (1)
- Blütenkelch (1)
- Bragg peak (1)
- Brake set-up (1)
- Braking curves (1)
- Branding (1)
- Broschüre (1)
- Building Automation (1)
- Business Process Intelligence (1)
- CO2 (1)
- CO2 emission reduction targets (1)
- CPQ (1)
- CRISPR/Cas9 (1)
- Carbon Dioxide (1)
- Chiralidon-R (1)
- Chiralidon-S (1)
- Clustering (1)
- Cognitive assistance system (1)
- Collagen fibrils (1)
- Competitiveness (1)
- Computerspiel (1)
- Conductive Boundary Condition (1)
- Connected Automated Vehicle (1)
- Connective tissues (1)
- Control (1)
- Corporatedesign (1)
- Cost function (1)
- Cramér-von-Mises test (1)
- Cross border adjustment mechanism (1)
- Cyclotron production (1)
- DPA (dipicolinic acid) (1)
- Datasets (1)
- Datenschutzgrundverordnung (1)
- Decision theory (1)
- Deep learning (1)
- Design Thinking (1)
- Digital (1)
- Digital leadership (1)
- Digital transformation (1)
- Digital triage (1)
- Digital twin (1)
- Diskurs (1)
- Diskussionskarten (1)
- Distinktion (1)
- District data model (1)
- District energy planning platform (1)
- Driver assistance system (1)
- Driving cycle recognition (1)
- E-Mobility (1)
- ECMS (1)
- Earthquake (1)
- Editorail Design (1)
- Education (1)
- Einkaufen (1)
- Eisenerz (1)
- Eishockey (1)
- Electrocardiography (1)
- Electrochemistry (1)
- Elektrotechnik (1)
- Elicit (1)
- Endometriose (1)
- Endothelial dysfunction (1)
- Energy Disaggregation (1)
- Energy management strategies (1)
- Energy market design (1)
- Energy storage (1)
- Energy system planning (1)
- Energy-intensive industry (1)
- Entdecken (1)
- Erkunden (1)
- Erneuerbare Energien (1)
- Erweiterbar (1)
- Experimentalfilm (1)
- Experteninterviews (1)
- Expertise (1)
- Extracellular matrix (ECM) (1)
- FH Aachen (1)
- Fahrzeug (1)
- Familie (1)
- Familienkasse (1)
- Fan-Kultur (1)
- Fans (1)
- Feldsimulation (1)
- Fenster (1)
- Finland (1)
- Floor prices (1)
- Freight rail (1)
- Future skills (1)
- Fußball (1)
- Fußballtrikot (1)
- Ga-68 (1)
- Gamification (1)
- Gehirn (1)
- Gemüse (1)
- Germany (1)
- Gerüche (1)
- Gesellschaftskritik (1)
- Gesteine (1)
- Gesundheit (1)
- GewohnheitDerHaltung (1)
- Glas (1)
- Good News Fokus (1)
- Grabstaetten (1)
- Grafikdesign (1)
- Griechisch (1)
- Habitate (1)
- Haltung (1)
- Haltungsschwäche (1)
- Handwerk (1)
- Hardcase (1)
- Haushaltsgerät (1)
- Heimat (1)
- Hindernisse (1)
- Historie (1)
- Hochfrequenztechnik (1)
- Home Assistant (1)
- Home Automation Platform (1)
- Human factors (1)
- Human-centered work design (1)
- Human-robot collaboration (1)
- ITFS (1)
- Ice melting probe (1)
- Ice penetration (1)
- Icy moons (1)
- Identifikation (1)
- Incomplete data (1)
- Informationsdesign (1)
- Informationsfluss (1)
- Inklusion (1)
- Inklusiv (1)
- Innovation (1)
- Instagram store (1)
- Interculturality (1)
- Intuitiv (1)
- Inverse Scattering (1)
- J.R.R Tolkien (1)
- Japan (1)
- KI (1)
- Kampagne (1)
- Key competences (1)
- Kindererziehung (1)
- Kinderfahrrad (1)
- Kindheit (1)
- Klassizismus (1)
- Klimakrise (1)
- Kochen (1)
- Kommunikation (1)
- Konservierung (1)
- Kooperation (1)
- Krankheit (1)
- Kreativer Bildungsweg (1)
- Krise (1)
- Kulturgut (1)
- Kunst (1)
- Kunstsammlung (1)
- Kurzfilme (1)
- Küche (1)
- Künstliche Intelligenz (1)
- Lactobacillus rhamnosus GG (1)
- Latentes Wasser (1)
- Latvia (1)
- LbL films (1)
- Leaderboard (1)
- Lebensmittel (1)
- Leichen (1)
- Leitfaden (1)
- Lernen (1)
- Letraset (1)
- Levulinic acid (1)
- Lichtkunst (1)
- Lichtkunst Museum (1)
- Linkshändigkeit (1)
- Livestream (1)
- Long COVID (1)
- Machine Learning (1)
- Magazin (1)
- Marginal homogeneity (1)
- Market modeling (1)
- Mars (1)
- Masonry partition walls (1)
- Mechanical stability (1)
- Medical radionuclide production (1)
- Medienjournalist (1)
- Meere (1)
- Metal contaminants (1)
- Microfluidic solvent extraction (1)
- Micromix (1)
- Mineral (1)
- Mineralien (1)
- Minimum Risk Manoeuvre (1)
- Minor chemistry (1)
- Mittelalter (1)
- Mobil (1)
- Mobility transition (1)
- Mobilität (1)
- Modernität (1)
- Modular (1)
- Modulbau (1)
- Motivation (1)
- Mpc (1)
- Multi-criteria decision analysis (1)
- Multi-objective optimization (1)
- Mutter (1)
- Männlichkeit (1)
- Nachhaltig (1)
- Nahrung (1)
- Narzissmus (1)
- Natural Language Processing (1)
- Natural language understanding (1)
- Navigation (1)
- Neue Arbeitsweise (1)
- Neugestaltung (1)
- Neural networks (1)
- Ocean worlds (1)
- Office (1)
- Open Source (1)
- Operational Design Domain (1)
- Optimierung (1)
- Out-of-plane capacity (1)
- Ozean (1)
- PLS (1)
- Paired sample (1)
- Path planning (1)
- Path-following (1)
- Pendelleuchte (1)
- Pendelnde (1)
- Performance (1)
- Personality (1)
- Perspektive (1)
- Pflanzenteile (1)
- Physical chemistry (1)
- Physical chemistry basics (1)
- Physical chemistry starters (1)
- Pizza (1)
- Plakat (1)
- Plasmatechnik (1)
- Politik (1)
- Portalrahmen (1)
- Positives Feedback (1)
- Post-COVID-19 syndrome (1)
- Predictive battery discharge (1)
- Preference assessment (1)
- Privacy (1)
- Process Model Extraction (1)
- Process optimization (1)
- Produktion (1)
- Profile extraction (1)
- Prototype (1)
- Prozessauswahl (1)
- Prozessautomatisierung (1)
- Prozessverbesserung (1)
- Psychologie (1)
- Quality control (1)
- Quelle-Fertighaus (1)
- Query learning (1)
- RWTH Aachen (1)
- Raman spectroscopy (1)
- Regie (1)
- Regionalization (1)
- Rehabilitaion (1)
- Relation classification (1)
- Renewable energy integration (1)
- Reproducible research (1)
- Responsibility (1)
- Restaurierung (1)
- Riten (1)
- Robotic Process Automation (1)
- Rotary encoder (1)
- Rotring (1)
- Roverandom (1)
- Rucksack (1)
- Ruhe (1)
- Rückgabe (1)
- SOA (1)
- Sachbuch (1)
- Schadensersatz (1)
- Schattenseite (1)
- Schauspiel (1)
- Schauspielhaus (1)
- Schein (1)
- Schriftvarianten (1)
- Seepferdchen (1)
- Sehbehinderung (1)
- Selektionskriterien (1)
- Sendungskonzeption (1)
- Sensors comparison (1)
- Serie (1)
- Sharing (1)
- Shiba Inu (1)
- Shunting (1)
- Siegerland (1)
- Slab deflection (1)
- Smart Building (1)
- Smart-Home (1)
- Sn₃O₄ (1)
- Social impact measurement (1)
- Society (1)
- Software (1)
- Software development (1)
- Software testing (1)
- Softwareentwicklung (1)
- Solarenergie (1)
- Sonderausstellung (1)
- Sonderzeichen (1)
- Sozialleistungen (1)
- Spezies (1)
- Sport (1)
- Stadt Aachen (1)
- Stahlkonstruktion (1)
- Starterkit (1)
- Steckverbindung (1)
- Steel industry (1)
- Storytelling (1)
- Stress (1)
- Stress testing (1)
- Stuttgart (1)
- Sustainable engineering education (1)
- Tanz (1)
- Tapered ends (1)
- Tauchboot (1)
- Teamwork (1)
- Technologie (1)
- Telefonat (1)
- Text Mining (1)
- Text mining (1)
- Theater (1)
- Thermodynamics as minor (1)
- Time-series synchronization (1)
- Tochter (1)
- Tod (1)
- Toolbar (1)
- Transdisciplinarity (1)
- Transformative Competencies (1)
- Transiton of Control (1)
- Transmission Eigenvalues (1)
- Triage-app (1)
- Trickfilm-Festival (1)
- Trikot (1)
- Trustworthy artificial intelligence (1)
- UI (1)
- UI Design (1)
- UI/UX-Design (1)
- UX (1)
- UX Design (1)
- Unterstützung (1)
- Unterwasserwelt (1)
- Urbane Gestaltung (1)
- Urbanisierung (1)
- Usability (1)
- V2X (1)
- Variable Schriften (1)
- Vater (1)
- Verwesung (1)
- Virtuelles Wasser (1)
- Visuelle Gestaltung (1)
- Volumes of confidence regions (1)
- Wallrafmuseum (1)
- Wasserknappheit (1)
- Wattenmeer (1)
- Wearable electronic device (1)
- Weiterentwicklung (1)
- Werkstatt (1)
- Werkzeuge (1)
- Wiegand sensor (1)
- Windkraft (1)
- Work-Life-Balance (1)
- Workaholic (1)
- Wortmarke (1)
- Zeit (1)
- Zoo (1)
- Zug (1)
- active learning (1)
- adaptive systems (1)
- additive manufacturing (1)
- aircraft engine (1)
- allocation (1)
- analog (1)
- anammox (1)
- artificial intelligence (1)
- aspergillus (1)
- assistance system (1)
- bacterial cellulose (1)
- biofilms (1)
- biological dosimeter (1)
- biomechanics (1)
- biosensor (1)
- central symmetry test (1)
- climate change (1)
- combustion (1)
- compression behavior (1)
- conditional excess distribution (1)
- conditional expectation principle (1)
- confidence interval (1)
- connective tissue (1)
- covariance principle (1)
- deficit irrigation (1)
- electromyography (1)
- emission index (1)
- energy efficiency (1)
- entrepreneurship education (1)
- enzyme cascade (1)
- exchangeability test (1)
- factory planning (1)
- field-effect sensor (1)
- filamentous fungi (1)
- forecast (1)
- fuel cell vehicle (1)
- fused filament fabrication (1)
- gamification (1)
- genome engineering (1)
- glucose oxidase (GOx) (1)
- goodness-of-fit test (1)
- heavy metals (1)
- horseradish peroxidase (HRP) (1)
- hydrogel (1)
- hydrogen (1)
- immobilization (1)
- independence test (1)
- infill strategy (1)
- intelligent control (1)
- intelligent energy management (1)
- klimakrise (1)
- klimawandel (1)
- lab work (1)
- locomotion (1)
- machine learning (1)
- mainstream deammonification (1)
- manufacturing (1)
- manufacturing data model (1)
- manufacturing flexibility (1)
- nachhaltiges Bauen (1)
- nanobelts (1)
- neutrons (1)
- niedlich (1)
- nitric oxides (1)
- nitrogen elimination (1)
- not identically distributed (1)
- onion (1)
- optical fibers (1)
- optical sensor setup (1)
- optical trapping (1)
- optimization system (1)
- overload (1)
- physiology (1)
- polyetheretherketone (PEEK) (1)
- portfolio risk (1)
- prebiotic (1)
- production planning and control (1)
- professional skills (1)
- proton therapy (1)
- protons (1)
- purchase factor (1)
- random effects (1)
- rapid tooling (1)
- relative dosimetry (1)
- retinal microvasculature (1)
- service-oriented architectures (1)
- shopping behavior (1)
- sterilization (1)
- stretch-shortening cycle (1)
- structural equation model (1)
- technology planning (1)
- tobacco mosaic virus (TMV) (1)
- turnip vein clearing virus (TVCV) (1)
- wastewater (1)
- water economy (1)
- yield (1)
Institute
- Fachbereich Gestaltung (55)
- Fachbereich Medizintechnik und Technomathematik (31)
- Fachbereich Elektrotechnik und Informationstechnik (22)
- ECSM European Center for Sustainable Mobility (18)
- Fachbereich Luft- und Raumfahrttechnik (16)
- Fachbereich Wirtschaftswissenschaften (14)
- Fachbereich Energietechnik (11)
- Fachbereich Chemie und Biotechnologie (8)
- Fachbereich Maschinenbau und Mechatronik (7)
- IfB - Institut für Bioengineering (7)
- MASKOR Institut für Mobile Autonome Systeme und Kognitive Robotik (6)
- INB - Institut für Nano- und Biotechnologien (5)
- Fachbereich Bauingenieurwesen (4)
- Nowum-Energy (4)
- Kommission für Forschung und Entwicklung (3)
- Solar-Institut Jülich (3)
- Institut fuer Angewandte Polymerchemie (2)
- FH Aachen (1)
- Fachbereich Architektur (1)
- IBB - Institut für Baustoffe und Baukonstruktionen (1)
Die Verfasser stellen in ihrem Beitrag die künftig in Kraft tretenden oder schon in Kraft getretenen Gesetzesvorhaben der europäischen Union vor. Vorab werde auf die abgelaufene Frist zur Anpassung von Standardvertragsklausel hingewiesen. Die Anpassung könne ggf. durch den Data Privacy Act der Kommission bewirkt werden, da dieser eine Angemessenheit suggeriere. Neben dem Digital Markets Act, der die Wahrung der Diskriminierungsfreiheit den Gatekeeper-Plattformen bezüglich der Bewerbung von Waren Dritter vorschreibt, sind ebenfalls der Digital Service Act und der Data Governance Act in Kraft getreten und werden künftig wirksam. Letzteres bezweckt den Datenaustausch von nicht-personenbezogenen Daten öffentlich-rechtlicher Datensätze, wobei anders als bei DSA, der die Verbraucherrechte durchsetzen möchte, mangels Verpflichtung die praktische Umsetzung ausbleiben werde. In der Entwurfsphase stecken der Artificial Intelligence Act, der Data Act, sowie der Cyber Resilience Act. Allen drei sei wegen dem weiten Anwendungsspielraum, der Bußgeldandrohung oder der Cyber-Bedrohungslage besondere praktische Relevanz beizumessen. Die Kommission weite durch diese Gesetzesvorhaben ihre Regelungsabsicht auch auf nicht-personenbezogene Daten und dem Datentransfer aus. Im Ergebnis werden die Unternehmen mit mehr Verpflichtungen konfrontiert, zu dessen Umsetzung ein funktionierendes Compliance-Management-System unabdingbar sei.
Datenschutz & Datenrecht – ein Ausblick auf 2023: Nationale Entwicklungen, EuGH-Vorlagen & Aufsicht
(2023)
Die Verfasser vermitteln einen Überblick über die nationalen Gesetzgebungsverfahren und wesentliche EuGH-Vorlagefragen betreffend den Datenschutz und das Datenrecht für das Jahr 2023. Zunächst folgen u.a. Hinweise in Bezug auf den Hinweisgeberschutz, die Verabschiedung der Einwilligungsverwaltungs-Verordnung zur Konkretisierung des § 26 TTDSG und das Mobilitätsdatengesetz. Anschließend werden Vorlagefragen deutscher Gerichte, die dem EuGH vorgelegt und bereits am 12.01.2023 beantwortet wurden, wie etwa C-154/21 und C-132/21 und die EuGH-Entscheidung vom 9.2.2023 (C-453/21), thematisiert. Überdies führen die Autoren wesentliche Entscheidungen des EuGH an, die im Jahr 2023 aus dem Bereich Datenrecht und Datenschutz zu erwarten seien. Auch Aktivitäten der Datenschutzaufsicht auf nationaler und europäischer Ebene finden Erwähnung. Die Verfasser machen abschließend auf besonders interessante Entscheidungen, die 2023 erwartet werden, wie etwa das EuGH-Urteil zum Auskunftsanspruch, sowie auf das Verhältnis des der Whistleblowing-RL umzusetzende Hinweisgeberschutzgesetz einerseits und Vorgaben des Datenschutzes andererseits, aufmerksam. Sie empfehlen, die künftige Rechtsprechung des EuGH im Blick zu behalten.
In dem vorliegenden Beitrag setzt sich der Verfasser mit dem Urteil des EuGH vom 4.5.2023 (Az.: C-60/22, DSB 2023, 178) zu den Auswirkungen eines formellen Verstoßes des Verantwortlichen gegen die Pflichten aus Artt. 26, 30 DSGVO (juris: EUV 2016/679) auf die Rechtmäßigkeit der Datenverarbeitung auseinander. Nachdem zunächst der zugrunde liegende Sachverhalt und der Hintergrund des Vorlageverfahrens skizziert wurden, gibt der Verfasser einen Überblick über die wesentlichen Entscheidungsgründe des EuGH. Insbesondere stelle der EuGH hier fest, dass die Rechtmäßigkeit der Verarbeitung in Art. 6 DSGVO geregelt sei und sich eine rechtswidrige Verarbeitung daher nur aus einem Verstoß gegen die Artt. 6 ff. DSGVO ergeben könne; die Pflichten aus Art. 26 und Art. 30 DSGVO würden nicht zu den Gründen für die Rechtmäßigkeit der Verarbeitung zählen. Mit Blick auf die Praxis lasse sich, so der Verfasser abschließend, festhalten, dass die Entscheidung insofern nicht überraschend sei; jedoch sei die Feststellung, dass sich aus Verstößen gegen Art. 26 und Art. 30 DSGVO kein Verstoß gegen das Grundrecht auf den Schutz personenbezogener Daten nachweisen lasse überraschend und bedenklich. Auch überrasche es, dass der EuGH eher in einem Nebensatz feststelle, dass der Verantwortliche im Prozess aufgrund seiner Rechenschaftspflicht gegenüber Betroffenen beweisbelastet ist; ob sich die Kammer hier der möglichen Auswirkungen ihrer Ausführungen bewusst gewesen sei, bleibe fraglich.
Umsatzbasierte Bußgelder – wie sonst nur aus dem Kartellrecht bekannt – waren einer der Gründe, warum die Datenschutz-Grundverordnung (DSGVO) vor ihrem Inkrafttreten für erhebliches Aufsehen sorgte. Die vielfach relevanteren Schadensersatzansprüche, die, wie bei „Dieselgate“, aufgrund der Vielzahl von betroffenen Personen und der aus Sicht von Rechtsdienstleistern bestehenden Skalierbarkeit mit weitaus höheren Einbußen für Unternehmen einhergehen können, blieben zunächst unbeachtet. Inzwischen ist der Schadensersatzanspruch gem. Art. 82 DSGVO die Vorschrift, die die meisten Vorlagen zum Europäischen Gerichtshof (EuGH) der letzten Jahre hervorgerufen hat. Am 4.5.2023 hat nun der EuGH (Urteil v. 4.5.2023 - Rs. C-300/21, NWB GAAAJ-41389) in einem Grundsatzurteil über zentrale Fragen rund um den Ersatz immaterieller Schäden als Folge von Datenschutzverstößen entschieden.
In recent years, the development of large pretrained language models, such as BERT and GPT, significantly improved information extraction systems on various tasks, including relation classification. State-of-the-art systems are highly accurate on scientific benchmarks. A lack of explainability is currently a complicating factor in many real-world applications. Comprehensible systems are necessary to prevent biased, counterintuitive, or harmful decisions.
We introduce semantic extents, a concept to analyze decision patterns for the relation classification task. Semantic extents are the most influential parts of texts concerning classification decisions. Our definition allows similar procedures to determine semantic extents for humans and models. We provide an annotation tool and a software framework to determine semantic extents for humans and models conveniently and reproducibly. Comparing both reveals that models tend to learn shortcut patterns from data. These patterns are hard to detect with current interpretability methods, such as input reductions. Our approach can help detect and eliminate spurious decision patterns during model development. Semantic extents can increase the reliability and security of natural language processing systems. Semantic extents are an essential step in enabling applications in critical areas like healthcare or finance. Moreover, our work opens new research directions for developing methods to explain deep learning models.
Extracting workflow nets from textual descriptions can be used to simplify guidelines or formalize textual descriptions of formal processes like business processes and algorithms. The task of manually extracting processes, however, requires domain expertise and effort. While automatic process model extraction is desirable, annotating texts with formalized process models is expensive. Therefore, there are only a few machine-learning-based extraction approaches. Rule-based approaches, in turn, require domain specificity to work well and can rarely distinguish relevant and irrelevant information in textual descriptions. In this paper, we present GUIDO, a hybrid approach to the process model extraction task that first, classifies sentences regarding their relevance to the process model, using a BERT-based sentence classifier, and second, extracts a process model from the sentences classified as relevant, using dependency parsing. The presented approach achieves significantly better resul ts than a pure rule-based approach. GUIDO achieves an average behavioral similarity score of 0.93. Still, in comparison to purely machine-learning-based approaches, the annotation costs stay low.
The work in modern open-pit and underground mines requires the transportation of large amounts of resources between fixed points. The navigation to these fixed points is a repetitive task that can be automated. The challenge in automating the navigation of vehicles commonly used in mines is the systemic properties of such vehicles. Many mining vehicles, such as the one we have used in the research for this paper, use steering systems with an articulated joint bending the vehicle’s drive axis to change its course and a hydraulic drive system to actuate axial drive components or the movements of tippers if available. To address the difficulties of controlling such a vehicle, we present a model-predictive approach for controlling the vehicle. While the control optimisation based on a parallel error minimisation of the predicted state has already been established in the past, we provide insight into the design and implementation of an MPC for an articulated mining vehicle and show the results of real-world experiments in an open-pit mine environment.
Supervised machine learning and deep learning require a large amount of labeled data, which data scientists obtain in a manual, and time-consuming annotation process. To mitigate this challenge, Active Learning (AL) proposes promising data points to annotators they annotate next instead of a subsequent or random sample. This method is supposed to save annotation effort while maintaining model performance.
However, practitioners face many AL strategies for different tasks and need an empirical basis to choose between them. Surveys categorize AL strategies into taxonomies without performance indications. Presentations of novel AL strategies compare the performance to a small subset of strategies. Our contribution addresses the empirical basis by introducing a reproducible active learning evaluation (ALE) framework for the comparative evaluation of AL strategies in NLP.
The framework allows the implementation of AL strategies with low effort and a fair data-driven comparison through defining and tracking experiment parameters (e.g., initial dataset size, number of data points per query step, and the budget). ALE helps practitioners to make more informed decisions, and researchers can focus on developing new, effective AL strategies and deriving best practices for specific use cases. With best practices, practitioners can lower their annotation costs. We present a case study to illustrate how to use the framework.
Messenger apps like WhatsApp and Telegram are frequently used for everyday communication, but they can also be utilized as a platform for illegal activity. Telegram allows public groups with up to 200.000 participants. Criminals use these public groups for trading illegal commodities and services, which becomes a concern for law enforcement agencies, who manually monitor suspicious activity in these chat rooms. This research demonstrates how natural language processing (NLP) can assist in analyzing these chat rooms, providing an explorative overview of the domain and facilitating purposeful analyses of user behavior. We provide a publicly available corpus of annotated text messages with entities and relations from four self-proclaimed black market chat rooms. Our pipeline approach aggregates the extracted product attributes from user messages to profiles and uses these with their sold products as features for clustering. The extracted structured information is the foundation for further data exploration, such as identifying the top vendors or fine-granular price analyses. Our evaluation shows that pretrained word vectors perform better for unsupervised clustering than state-of-the-art transformer models, while the latter is still superior for sequence labeling.