REPORT A PROBLEMicon

Fields marked with an asterisk are required
*
*
*
*
captcha
I hereby confirm that I have read and accept regulations and privacy policies *

LINKS

Resource link (portal)

Resource link (repository)

https://id.e-science.pl/records/83189

Resource type: dataset, database

Technical Contradictions extracted from patent documents

View

Resource metadata

Title Technical Contradictions extracted from patent documents
Persons Authors: Marek Mysior
Partner: Wrocław University of Science and Technology
Description This dataset contains 141 Technical Contradictions extracted from .pdf files of 20 patents, using four Large Language Models: claude-sonnet-4, gpt-4.1, qwen3:32b and llama3.3:70b. Each extracted Technical Contradiction was manually assessed as either correct, or not (123 correct in total). Also, for each contradiction, a hallucination label (0/1) is provided, whether the contradiction can be inferred from the patent document (0) or not (1). Additionally, a .md file containing the prompt used in the extraction process as well as the JSON schema for the structured output is provided in .json

The dataset was created as a result of the research project titled: "Analysis of the effectiveness of Large Language Models (LLM) in identifying technical contradictions", funded by the National Science Centre, Poland, grant no.: 2024/08/X/ST8/00391. Results for open-source models were
obtained using resources provided by the Wroclaw Centre for Networking and Super-
computing http://wcss.pl. (English)
Description in another language: Ten zbiór danych zawiera 141 Sprzeczności Technicznych wyodrębnionych z plików .pdf 20 patentów przy użyciu czterech dużych modeli językowych: claude-sonnet-4, gpt-4.1, qwen3:32b oraz llama3.3:70b. Każda wyodrębniona Sprzeczność Techniczna została oceniona ręcznie jako poprawna lub niepoprawna (łącznie 123 poprawne). Dodatkowo, każdej sprzeczności przypisano etykietę halucynacji (0/1), wskazującą, czy sprzeczność wynika bezpośrednio z treści dokumentu patentowego (0), czy też nie (1). Udostępniono również plik .md zawierający prompt użyty w procesie ekstrakcji oraz plik .json z definicją schematu strukturalnego wyjścia.

Zbiór danych powstał w ramach projektu badawczego pt. „Analiza efektywności wykorzystania dużych modeli językowych (LLM) w identyfikowaniu sprzeczności technicznych”, finansowanego przez Narodowe Centrum Nauki, nr grantu: 2024/08/X/ST8/00391. Wyniki dla modeli open-source uzyskano z wykorzystaniem zasobów Wrocławskiego Centrum Sieciowo-Superkomputerowego http://wcss.pl. (Polish)
Comments: Zbiór danych powstał w ramach projektu badawczego pt. „Analiza efektywności wykorzystania dużych modeli językowych (LLM) w identyfikowaniu sprzeczności technicznych”, finansowanego przez Narodowe Centrum Nauki, nr grantu: 2024/08/X/ST8/00391. Wyniki dla modeli open-source uzyskano z wykorzystaniem zasobów Wrocławskiego Centrum Sieciowo-Superkomputerowego http://wcss.pl.
Keywords "Patent"@pl, "patent"@en, "TRIZ"@en, "TRIZ"@pl, "contradiction"@en, "llm"@en
Classification Resource type: dataset, database
Scientific discipline: Dziedzina nauk inżynieryjno-technicznych / inżynieria mechaniczna (2018)
Destination group: entrepreneurs, scientists
Harmful content: No
Characteristics Place of creation: Politechnika Wrocławska
Creation time: 2025
Number of data records: 141
Resource language: English
License CC BY 4.0
Technical information Submitter: Marek Mysior
Availability date: 29-09-2025
Collections Kolekcja Politechniki Wrocławskiej

Citation

Copied

Marek Mysior. Technical Contradictions extracted from patent documents. [dataset, database] Available in Atlas of Open Science Resources, . License: CC BY 4.0, https://creativecommons.org/licenses/by/4.0/legalcode.pl. Date of access: DD.MM.RRRR.

Similar resources

Rozproszone systemy dystrybucji biogazu. Badania, projektowanie i rozwój

Sebastian Koziołek, Andrzej Białowiec, Marek Mysior, Mateusz Słupiński, Mariusz Ptak, Damian Derlukiewicz, book, Wrocław University of Science and Technology, dziedzina nauk technicznych / energetyka (2011)

TRIZ Future Conference 2016

video, Wrocław University of Science and Technology, materiały popularnonaukowe i inne (2011)

Technical Contradictions extracted from patent documents

Marek Mysior, dataset, database, Wrocław University of Science and Technology, Dziedzina nauk inżynieryjno-technicznych / inżynieria mechaniczna (2018)

Technical Contradictions extracted from patent documents

Marek Mysior, dataset, database, Wrocław University of Science and Technology, Dziedzina nauk inżynieryjno-technicznych / inżynieria mechaniczna (2018)

See more