import pandas as pd
df = pd.DataFrame({"column_a": [1.1, 2.1, 3.5],
                   "column_b": [2.4, 5.2, 2.2]}, index=[10, 11, 12])
df.index.name = "index" 
df

import sdata
print("sdata v{}".format(sdata.__version__))

sdata v0.24.1

data = sdata.Data(name="my data name", table=df, description="my data description")
print("data:            \t {0}".format(type(data)))
print("data.metadata:   \t {0}".format(type(data.metadata)))
print("data.table:      \t {0}".format(type(data.table)))
print("data.description:\t {0}".format(type(data.description)))

data:            	 <class 'sdata.data.Data'>
data.metadata:   	 <class 'sdata.metadata.Metadata'>
data.table:      	 <class 'pandas.core.frame.DataFrame'>
data.description:	 <class 'str'>

data = sdata.Data(name="basic example")
print("data.name:\t '{0.name}'".format(data))

data.name:	 'basic example'

data = sdata.Data(uuid="8b1e85eded1241eb854be3365bcf9884")
print("data.uuid:\t '{0.uuid}'".format(data))

data.uuid:	 '8b1e85eded1241eb854be3365bcf9884'

my_uuid = sdata.uuid_from_str("Das ist ein möglichst eindeutiger Name für die Daten")
data = sdata.Data(uuid=my_uuid)
print("data.uuid:\t '{0.uuid}'".format(data))

data.uuid:	 '06f8c76b037c3636a40246f024e87574'

attribute1 = sdata.Attribute("Augenfarbe", "blau")
attribute1

(Attr'Augenfarbe':blau(str))

attribute2 = sdata.Attribute(name="answer", 
                             value=42, 
                             dtype="int", 
                             unit="-", 
                             description="""The Answer to the Ultimate Question of Life, The Universe, and Everything""", 
                             label="Die Antwort")
attribute2.to_dict()

{'name': 'answer',
 'value': 42,
 'unit': '-',
 'dtype': 'int',
 'description': 'The Answer to the Ultimate Question of Life, The Universe, and Everything',
 'label': 'Die Antwort',
 'required': False}

metadata = sdata.Metadata()
metadata.add(attribute1)
metadata.add(attribute2)
print(metadata)
print(metadata.df)

(Metadata'N.N.':2 ['Augenfarbe', 'answer'])
                  name value unit dtype  \
key                                       
Augenfarbe  Augenfarbe  blau    -   str   
answer          answer    42    -   int   

                                                  description        label  \
key                                                                          
Augenfarbe                                                                   
answer      The Answer to the Ultimate Question of Life, T...  Die Antwort   

            required  
key                   
Augenfarbe     False  
answer         False

data = sdata.Data(name="basic example", 
                  uuid="38b26864e7794f5182d38459bab85842", 
                  table=df)
data.metadata.add("Temperatur", 
                  value=25.4, 
                  dtype="float", 
                  unit="degC", 
                  description="Temperatur", 
                  label="Temperatur T [°C]")
print(data.metadata.df)

                          name  \
key                              
!sdata_class      !sdata_class   
!sdata_ctime      !sdata_ctime   
!sdata_mtime      !sdata_mtime   
!sdata_name        !sdata_name   
!sdata_parent    !sdata_parent   
!sdata_project  !sdata_project   
!sdata_sname      !sdata_sname   
!sdata_suuid      !sdata_suuid   
!sdata_url          !sdata_url   
!sdata_uuid        !sdata_uuid   
!sdata_version  !sdata_version   
Temperatur          Temperatur   

                                                            value  unit  \
key                                                                       
!sdata_class                                                 Data     -   
!sdata_ctime                     2025-01-14T16:36:43.417091+00:00     -   
!sdata_mtime                     2025-01-14T16:36:43.417137+00:00     -   
!sdata_name                                         basic example     -   
!sdata_parent                                                         -   
!sdata_project                                               N.N.     -   
!sdata_sname    Data|basic example|38b26864e7794f5182d38459bab...     -   
!sdata_suuid    MzhiMjY4NjRlNzc5NGY1MTgyZDM4NDU5YmFiODU4NDJEYX...     -   
!sdata_url                                                            -   
!sdata_uuid                      38b26864e7794f5182d38459bab85842     -   
!sdata_version                                             0.24.1     -   
Temperatur                                                   25.4  degC   

                dtype                          description              label  \
key                                                                             
!sdata_class      str                          sdata class                      
!sdata_ctime      str                        creation date                      
!sdata_mtime      str                    modification date                      
!sdata_name       str              name of the data object                      
!sdata_parent     str      uuid of the parent sdata object                      
!sdata_project    str                         project name                      
!sdata_sname      str             sname of the data object                      
!sdata_suuid      str  Super Universally Unique Identifier                      
!sdata_url        str               url of the data object                      
!sdata_uuid       str        Universally Unique Identifier                      
!sdata_version    str                sdata package version                      
Temperatur      float                           Temperatur  Temperatur T [°C]   

                required  
key                       
!sdata_class       False  
!sdata_ctime       False  
!sdata_mtime       False  
!sdata_name        False  
!sdata_parent      False  
!sdata_project     False  
!sdata_sname       False  
!sdata_suuid       False  
!sdata_url         False  
!sdata_uuid        False  
!sdata_version     False  
Temperatur         False

df = pd.DataFrame({"time": [1.1, 2.1, 3.5],
                   "temperature": [2.4, 5.2, 2.2]}, index=[0, 1, 2])
df.index.name = "index" 
df

data.description = "Messergebnis Temperatur."
print(data.description)

Messergebnis Temperatur.

data.description = r"""# Messergebnis Temperatur
## subheader

a remarkable text

Bullet list:

- aaa
    - aaa.b
- bbb


Numbered list:

1. foo
1. bar

$f(x) = \frac{1}{2}\sin(x)$

code:

    name = "basic example"

A [Link](https://github.com/lepy/sdata)."""

print(data.description)

# Messergebnis Temperatur
## subheader

a remarkable text

Bullet list:

- aaa
    - aaa.b
- bbb


Numbered list:

1. foo
1. bar

$f(x) = \frac{1}{2}\sin(x)$

code:

    name = "basic example"

A [Link](https://github.com/lepy/sdata).

df = pd.DataFrame({"time": [1.1, 2.1, 3.5],
                   "temperature": [2.4, 5.2, 2.2]},
                  index=[0, 1, 2])
df

data_name = "Temperaturmessung-001"
data = sdata.Data(name=data_name, 
                  uuid=sdata.uuid_from_str(data_name),
                  table=df,
                  description="Messergebnis Temperatur")
data.metadata.add("time", 
                  value=None, 
                  dtype="float", 
                  unit="s", 
                  description="Zeitachse", 
                  label="time $t$")
data.metadata.add("temperature", 
                  value=None, 
                  dtype="float", 
                  unit="°C", 
                  description="Zeitachse", 
                  label="temperature $T$")
data.describe()

import matplotlib.pyplot as plt
fig, ax = plt.subplots()

x_var = "time"
y_var = "temperature" 

x_attr = data.metadata.get(x_var)
y_attr = data.metadata.get(y_var)

ax.plot(data.df[x_var], data.df[y_var], label=data.name)
ax.legend(loc="best")
ax.set_xlabel("{0.label} [{0.unit}]".format(x_attr))
ax.set_ylabel("{0.label} [{0.unit}]".format(y_attr))
print("plot")

plot

import os
filepath_xlsx = os.path.join("/tmp", data.osname + ".xlsx")
data.to_xlsx(filepath=filepath_xlsx)
print("Saved '{0.name}' to '{1}'.".format(data, filepath_xlsx))

Saved 'Temperaturmessung-001' to '/tmp/temperaturmessung-001.xlsx'.

filepath_json = os.path.join("/tmp", data.osname + ".json")
data.to_json(filepath=filepath_json)
print("Saved '{0.name}' to '{1}'.".format(data, filepath_json))

Saved 'Temperaturmessung-001' to '/tmp/temperaturmessung-001.json'.

filepath_csv = os.path.join("/tmp", data.osname + ".csv")
data.to_csv(filepath=filepath_csv)
print("Saved '{0.name}' to '{1}'.".format(data, filepath_csv))

Saved 'Temperaturmessung-001' to '/tmp/temperaturmessung-001.csv'.

filepath_xlsx = os.path.join("/tmp", data.osname + ".xlsx")
data_xlsx = data.from_xlsx(filepath=filepath_xlsx)
data_xlsx

(Data 'Temperaturmessung-001':e13d9387728c375eb98686eacf42b6df)

data.sha3_256_metadata, data_xlsx.sha3_256_metadata
data.description, data_xlsx.description

('Messergebnis Temperatur', 'Messergebnis Temperatur')

filepath_json = os.path.join("/tmp", data.osname + ".json")
data_json = data.from_json(filepath=filepath_json)
data_json

(Data 'Temperaturmessung-001':e13d9387728c375eb98686eacf42b6df)

#data.mdf, data_xlsx.mdf

filepath_parquet = os.path.join("/tmp", data.osname + ".pq")
data.to_parquet(filepath_parquet, engine="pyarrow")

filepath_parquet = os.path.join("/tmp", data.osname + ".pq")
data_pq = data.from_parquet(filepath=filepath_parquet)
data_pq

(Data 'Temperaturmessung-001':e13d9387728c375eb98686eacf42b6df)

print(data.sha3_256)
print(data_xlsx.sha3_256)
print(data_json.sha3_256)
print(data_pq.sha3_256)
assert data.sha3_256==data_xlsx.sha3_256
assert data.sha3_256==data_json.sha3_256
assert data.sha3_256==data_pq.sha3_256

d3dca5ae6fc3c0dad5273e5930c1946c59610d259ee54eb894e06d754efdd97f
d3dca5ae6fc3c0dad5273e5930c1946c59610d259ee54eb894e06d754efdd97f
d3dca5ae6fc3c0dad5273e5930c1946c59610d259ee54eb894e06d754efdd97f
d3dca5ae6fc3c0dad5273e5930c1946c59610d259ee54eb894e06d754efdd97f

Das sdata-Format¶

Ein Beispiel zur Ablage einer Tabelle im sdata-Format¶

Die Komponenten des sdata-Formates¶

sdata.Data.metadata¶

sdata.Data.table¶

sdata.Data.decription¶

Messergebnis Temperatur.¶

subheader¶

Beispiel einer Temperaturmessung-001¶

Export¶

Import¶

Zusammenfassung¶

	column_a	column_b
index
10	1.1	2.4
11	2.1	5.2
12	3.5	2.2

	time	temperature
index
0	1.1	2.4
1	2.1	5.2
2	3.5	2.2

	time	temperature
0	1.1	2.4
1	2.1	5.2
2	3.5	2.2

	0
metadata	13
table_rows	3
table_columns	2
description	23