Anzahl der Treffer: 325
Erstellt: Thu, 28 Mar 2024 23:11:59 +0100 in 0.0598 sec


Jibril, Muhammad Attahir; Baumstark, Alexander; Sattler, Kai-Uwe
Adaptive update handling for graph HTAP. - In: 2022 IEEE 38th International Conference on Data Engineering Workshops, (2022), S. 16-23

Processing hybrid transactional/analytical workloads on graph data can significantly benefit from GPU accelerators. However, to exploit the full potential of GPU processing, dedicated graph representations are necessary, which make inplace updates difficult. In this paper, we discuss an approach for adaptive handling of updates in a graph database system for HTAP workloads. We discuss and evaluate strategies for propagating updates from an update-friendly table storage to a GPU-optimized sparse matrix format.



https://doi.org/10.1109/ICDEW55742.2022.00007
Al-Sayeh, Hani; Memishi, Bunjamin; Jibril, Muhammad Attahir; Paradies, Marcus; Sattler, Kai-Uwe
JUGGLER: autonomous cost optimization and performance prediction of big data applications. - In: SIGMOD '22, (2022), S. 1840-1854

Distributed in-memory processing frameworks accelerate iterative workloads by caching suitable datasets in memory rather than recomputing them in each iteration. Selecting appropriate datasets to cache as well as allocating a suitable cluster configuration for caching these datasets play a crucial role in achieving optimal performance. In practice, both are tedious, time-consuming tasks and are often neglected by end users, who are typically not aware of workload semantics, sizes of intermediate data, and cluster specification. To address these problems, we present Juggler, an end-to-end framework, which autonomously selects appropriate datasets for caching and recommends a correspondingly suitable cluster configuration to end users, with the aim of achieving optimal execution time and cost. We evaluate Juggler on various iterative, real-world, machine learning applications. Compared with our baseline, Juggler reduces execution time to 25.1% and cost to 58.1%, on average, as a result of selecting suitable datasets for caching. It recommends optimal cluster configuration in 50% of cases and near-to-optimal configuration in the remaining cases. Moreover, Juggler achieves an average performance prediction accuracy of 90%.



https://doi.org/10.1145/3514221.3517892
Götze, Philipp;
Transactional and analytical data management on persistent memory. - Ilmenau : Universitätsbibliothek, 2022. - 1 Online-Ressource (XII, 144 Seiten, Seite XIII-XXXIV)
Technische Universität Ilmenau, Dissertation 2022

Die zunehmende Anzahl von Smart-Geräten und Sensoren, aber auch die sozialen Medien lassen das Datenvolumen und damit die geforderte Verarbeitungsgeschwindigkeit stetig wachsen. Gleichzeitig müssen viele Anwendungen Daten persistent speichern oder sogar strenge Transaktionsgarantien einhalten. Die neuartige Speichertechnologie Persistent Memory (PMem) mit ihren einzigartigen Eigenschaften scheint ein natürlicher Anwärter zu sein, um diesen Anforderungen effizient nachzukommen. Sie ist im Vergleich zu DRAM skalierbarer, günstiger und dauerhaft. Im Gegensatz zu Disks ist sie deutlich schneller und direkt adressierbar. Daher wird in dieser Dissertation der gezielte Einsatz von PMem untersucht, um den Anforderungen moderner Anwendung gerecht zu werden. Nach der Darlegung der grundlegenden Arbeitsweise von und mit PMem, konzentrieren wir uns primär auf drei Aspekte der Datenverwaltung. Zunächst zerlegen wir mehrere persistente Daten- und Indexstrukturen in ihre zugrundeliegenden Entwurfsprimitive, um Abwägungen für verschiedene Zugriffsmuster aufzuzeigen. So können wir ihre besten Anwendungsfälle und Schwachstellen, aber auch allgemeine Erkenntnisse über das Entwerfen von PMem-basierten Datenstrukturen ermitteln. Zweitens schlagen wir zwei Speicherlayouts vor, die auf analytische Arbeitslasten abzielen und eine effiziente Abfrageausführung auf beliebigen Attributen ermöglichen. Während der erste Ansatz eine verknüpfte Liste von mehrdimensionalen gruppierten Blöcken verwendet, handelt es sich beim zweiten Ansatz um einen mehrdimensionalen Index, der Knoten im DRAM zwischenspeichert. Drittens zeigen wir unter Verwendung der bisherigen Datenstrukturen und Erkenntnisse, wie Datenstrom- und Ereignisverarbeitungssysteme mit transaktionaler Zustandsverwaltung verbessert werden können. Dabei schlagen wir ein neuartiges Transactional Stream Processing (TSP) Modell mit geeigneten Konsistenz- und Nebenläufigkeitsprotokollen vor, die an PMem angepasst sind. Zusammen sollen die diskutierten Aspekte eine Grundlage für die Entwicklung noch ausgereifterer PMem-fähiger Systeme bilden. Gleichzeitig zeigen sie, wie Datenverwaltungsaufgaben PMem ausnutzen können, indem sie neue Anwendungsgebiete erschließen, die Leistung, Skalierbarkeit und Wiederherstellungsgarantien verbessern, die Codekomplexität vereinfachen sowie die ökonomischen und ökologischen Kosten reduzieren.



https://doi.org/10.22032/dbt.51870
Lehner, Wolfgang; Sattler, Kai-Uwe; Freytag, Johann-Christoph
BTW2021 erstmals als digitale Vortragsreihe. - In: Datenbank-Spektrum, ISSN 1610-1995, Bd. 22 (2022), 1, S. 67-71

19. Fachtagung des GI-Fachbereichs DBIS - Datenbanksysteme für Business, Technologie und Web - 2021 online organisiert von der TU Dresden



https://doi.org/10.1007/s13222-021-00402-x
Nguyen, Duy Cuong; Vu, Ngoc Pi; Long, Banh Tien; Puta, Horst; Sattler, Kai-Uwe
Advances in Engineering Research and Application : Proceedings of the International Conference on Engineering Research and Applications, ICERA 2021. - Cham : Springer, 2022. - XXVI, 944 Seiten. - (Lecture Notes in Networks and Systems ; volume 366) ISBN 978-3-030-92573-4

This book covers the International Conference on Engineering Research and Applications (ICERA 2021), which took place at Thai Nguyen University of Technology, Thai Nguyen, Vietnam on December 1–2, 2021, and provided an international forum to disseminate information on latest theories and practices in engineering research and applications. The conference focused on original research work in areas including mechanical engineering, materials and mechanics of materials, mechatronics and micromechatronics, automotive engineering, electrical and electronics engineering, information and communication technology. By disseminating the latest advances in the field, the Proceedings of ICERA 2021, Advances in Engineering Research and Application, helps academics and professionals alike to reshape their thinking on sustainable development. .



Jibril, Muhammad Attahir; Götze, Philipp; Broneske, David; Sattler, Kai-Uwe
Selective caching : a persistent memory approach for multi-dimensional index structures. - In: Distributed and parallel databases, ISSN 1573-7578, Bd. 40 (2022), 1, S. 47-66
Special Issue on Self-Managing and Hardware-Optimized Database Systems 2020

https://doi.org/10.1007/s10619-021-07327-0
Steinmetz, Nadine; Senthil-Kumar, Bhavya; Sattler, Kai-Uwe
Conversational question answering using a shift of context. - [Aachen, Germany] : [RWTH Aachen]. - 1 Online-Ressource (8 Seiten)Online-Ausgabe: EDBT/ICDT-WS 2021: EDBT/ICDT 2021 workshops : proceedings of the workshops of the EDBT/ICDT 2021 Joint Conference : Nicosia, Cyprus, March 23, 2021 / edited by EDBT/ICDT 2021 workshops proceedings chair Constantinos Costa, University of Pittsburgh, Pittsburgh, USA; EDBT/ICDT 2021 workshops chair Evaggelia Pitoura, University of Ioannina, Greece. - [Aachen, Germany] : [RWTH Aachen], 2021. - CEUR workshop proceedings ; vol-2841

https://doi.org/10.22032/dbt.51535
Hagedorn, Stefan; Kläbe, Steffen; Sattler, Kai-Uwe
Putting Pandas in a box. - [USA?] : CIDR Conference. - 1 Online-Ressource (6 Seiten)Publikation entstand im Rahmen der Veranstaltung: 11th Conference on Innovative Data Systems Research, CIDR 2021, Virtual Event, January 11-15, 2021, Online Proceedings, Session 3: Data Analytics

https://doi.org/10.22032/dbt.51534
Steinmetz, Nadine; Sattler, Kai-Uwe
What is in the KGQA benchmark datasets? Survey on challenges in datasets for question answering on knowledge graphs. - In: Journal on data semantics, ISSN 1861-2040, Bd. 10 (2021), 3/4, S. 241-265

Question Answering based on Knowledge Graphs (KGQA) still faces difficult challenges when transforming natural language (NL) to SPARQL queries. Simple questions only referring to one triple are answerable by most QA systems, but more complex questions requiring complex queries containing subqueries or several functions are still a tough challenge within this field of research. Evaluation results of QA systems therefore also might depend on the benchmark dataset the system has been tested on. For the purpose to give an overview and reveal specific characteristics, we examined currently available KGQA datasets regarding several challenging aspects. This paper presents a detailed look into the datasets and compares them in terms of challenges a KGQA system is facing.



https://doi.org/10.1007/s13740-021-00128-9
Hagedorn, Stefan; Kläbe, Steffen; Sattler, Kai-Uwe
Conquering a Panda's weaker self - fighting laziness with laziness : demo paper. - In: Advances in Database Technology - EDBT 2021, (2021), S. 670-673

https://doi.org/10.5441/002/edbt.2021.80