REPORT A PROBLEM
LINKS
Resource link (short)
http://www.zasobynauki.pl/zasoby/83188Resource link (repository)
https://id.e-science.pl/records/83188Resource metadata
| Title |
Technical Contradictions extracted from patent documents |
|---|---|
| Persons |
Authors:
Marek Mysior
Partner: Wrocław University of Science and Technology |
| Description |
This dataset contains 141 Technical Contradictions extracted from .pdf files of 20 patents, using four Large Language Models: claude-sonnet-4, gpt-4.1, qwen3:32b and llama3.3:70b. Each extracted Technical Contradiction was manually assessed as either correct, or not (123 correct in total). Also, for each contradiction, a hallucination label (0/1) is provided, whether the contradiction can be inferred from the patent document (0) or not (1). Additionally, a prompt used to extract those contradictions is provided in .j2 format, including The dataset was created as a result of the research project titled: "Analysis of the effectiveness of Large Language Models (LLM) in identifying technical contradictions", funded by the National Science Centre, Poland, grant no.: 2024/08/X/ST8/00391. Results for open-source models were obtained using resources provided by the Wroclaw Centre for Networking and Super- computing (http://wcss.pl). (English) Description in another language: Ten zbiór danych zawiera 141 Sprzeczności Technicznych wyekstrahowanych z plików .pdf dwudziestu patentów, z wykorzystaniem czterech dużych modeli językowych (LLM): claude-sonnet-4, gpt-4.1, qwen3:32b oraz llama3.3:70b. Każda wyekstrahowana Sprzeczność Techniczna została poddana ręcznej ocenie pod kątem poprawności (łącznie 123 uznane za poprawne). Dodatkowo, dla każdej sprzeczności podano etykietę halucynacji (0/1), określającą, czy dana sprzeczność wynika bezpośrednio z treści dokumentu patentowego (0), czy też nie (1). Zbiór danych został opracowany w ramach projektu badawczego pt. „Analiza efektywności wykorzystania dużych modeli językowych (LLM) w identyfikowaniu sprzeczności technicznych”, finansowanego przez Narodowe Centrum Nauki, nr grantu: 2024/08/X/ST8/00391. Wyniki dla modeli open-source uzyskano przy wykorzystaniu zasobów Wrocławskiego Centrum Sieciowo-Superkomputerowego (http://wcss.pl). (Polish) |
| Keywords | "Patent"@pl, "patent"@en, "TRIZ"@en, "TRIZ"@pl, "llm"@en, "sonnet"@en, "contradiction"@en |
| Classification |
Resource type:
dataset, database Scientific discipline: Dziedzina nauk inżynieryjno-technicznych / inżynieria mechaniczna (2018) Destination group: entrepreneurs, scientists Harmful content: No |
| Characteristics |
Place of creation: Politechnika Wrocławska
Creation time: 2025 Resource language: English |
| License | CC BY-SA 4.0 |
| Technical information |
Submitter: Marek Mysior Availability date: 29-09-2025 |
| Collections | Kolekcja Politechniki Wrocławskiej |
Similar resources
Rozproszone systemy dystrybucji biogazu. Badania, projektowanie i rozwój
Sebastian Koziołek, Andrzej Białowiec, Marek Mysior, Mateusz Słupiński, Mariusz Ptak, Damian Derlukiewicz, book, Wrocław University of Science and Technology, dziedzina nauk technicznych / energetyka (2011)
Technical Contradictions extracted from patent documents
Marek Mysior, dataset, database, Wrocław University of Science and Technology, Dziedzina nauk inżynieryjno-technicznych / inżynieria mechaniczna (2018)
TRIZ Future Conference 2016
video, Wrocław University of Science and Technology, materiały popularnonaukowe i inne (2011)
Technical Contradictions extracted from patent documents
Marek Mysior, dataset, database, Wrocław University of Science and Technology, Dziedzina nauk inżynieryjno-technicznych / inżynieria mechaniczna (2018)