REPORT A PROBLEM
LINKS
Resource link (short)
http://www.zasobynauki.pl/zasoby/83189Resource link (repository)
https://id.e-science.pl/records/83189Resource metadata
| Title |
Technical Contradictions extracted from patent documents |
|---|---|
| Persons |
Authors:
Marek Mysior
Partner: Wrocław University of Science and Technology |
| Description |
This dataset contains 141 Technical Contradictions extracted from .pdf files of 20 patents, using four Large Language Models: claude-sonnet-4, gpt-4.1, qwen3:32b and llama3.3:70b. Each extracted Technical Contradiction was manually assessed as either correct, or not (123 correct in total). Also, for each contradiction, a hallucination label (0/1) is provided, whether the contradiction can be inferred from the patent document (0) or not (1). Additionally, a .md file containing the prompt used in the extraction process as well as the JSON schema for the structured output is provided in .json The dataset was created as a result of the research project titled: "Analysis of the effectiveness of Large Language Models (LLM) in identifying technical contradictions", funded by the National Science Centre, Poland, grant no.: 2024/08/X/ST8/00391. Results for open-source models were obtained using resources provided by the Wroclaw Centre for Networking and Super- computing http://wcss.pl. (English) Description in another language: Ten zbiór danych zawiera 141 Sprzeczności Technicznych wyodrębnionych z plików .pdf 20 patentów przy użyciu czterech dużych modeli językowych: claude-sonnet-4, gpt-4.1, qwen3:32b oraz llama3.3:70b. Każda wyodrębniona Sprzeczność Techniczna została oceniona ręcznie jako poprawna lub niepoprawna (łącznie 123 poprawne). Dodatkowo, każdej sprzeczności przypisano etykietę halucynacji (0/1), wskazującą, czy sprzeczność wynika bezpośrednio z treści dokumentu patentowego (0), czy też nie (1). Udostępniono również plik .md zawierający prompt użyty w procesie ekstrakcji oraz plik .json z definicją schematu strukturalnego wyjścia. Zbiór danych powstał w ramach projektu badawczego pt. „Analiza efektywności wykorzystania dużych modeli językowych (LLM) w identyfikowaniu sprzeczności technicznych”, finansowanego przez Narodowe Centrum Nauki, nr grantu: 2024/08/X/ST8/00391. Wyniki dla modeli open-source uzyskano z wykorzystaniem zasobów Wrocławskiego Centrum Sieciowo-Superkomputerowego http://wcss.pl. (Polish) Comments: Zbiór danych powstał w ramach projektu badawczego pt. „Analiza efektywności wykorzystania dużych modeli językowych (LLM) w identyfikowaniu sprzeczności technicznych”, finansowanego przez Narodowe Centrum Nauki, nr grantu: 2024/08/X/ST8/00391. Wyniki dla modeli open-source uzyskano z wykorzystaniem zasobów Wrocławskiego Centrum Sieciowo-Superkomputerowego http://wcss.pl. |
| Keywords | "Patent"@pl, "patent"@en, "TRIZ"@en, "TRIZ"@pl, "contradiction"@en, "llm"@en |
| Classification |
Resource type:
dataset, database Scientific discipline: Dziedzina nauk inżynieryjno-technicznych / inżynieria mechaniczna (2018) Destination group: entrepreneurs, scientists Harmful content: No |
| Characteristics |
Place of creation: Politechnika Wrocławska
Creation time: 2025 Number of data records: 141 Resource language: English |
| License | CC BY 4.0 |
| Technical information |
Submitter: Marek Mysior Availability date: 29-09-2025 |
| Collections | Kolekcja Politechniki Wrocławskiej |
Similar resources
Rozproszone systemy dystrybucji biogazu. Badania, projektowanie i rozwój
Sebastian Koziołek, Andrzej Białowiec, Marek Mysior, Mateusz Słupiński, Mariusz Ptak, Damian Derlukiewicz, book, Wrocław University of Science and Technology, dziedzina nauk technicznych / energetyka (2011)
TRIZ Future Conference 2016
video, Wrocław University of Science and Technology, materiały popularnonaukowe i inne (2011)
Technical Contradictions extracted from patent documents
Marek Mysior, dataset, database, Wrocław University of Science and Technology, Dziedzina nauk inżynieryjno-technicznych / inżynieria mechaniczna (2018)
Technical Contradictions extracted from patent documents
Marek Mysior, dataset, database, Wrocław University of Science and Technology, Dziedzina nauk inżynieryjno-technicznych / inżynieria mechaniczna (2018)