I tillegg til de tre viktigste «kjerne»-datasettene ovenfor, er det et annet like viktig datasett som beskriver alle typer egenskaper, spesielt de som varierer innenfor en avling/husdyr/mikroorganisme: grunnlaget for hvorfor vi behandler dem som kultivarer (og raser og stammer) i utgangspunktet. Å finne og strukturere denne typen data for alle verdens domestiserte organismer er en overveldende oppgave, og vil være et hovedmål for stiftelsens aktivitet.

Kilder
Kilder vi bruker nå:
- Crop Ontology: https://cropontology.org/
- Bioversity: https://www.bioversityinternational.org/e-library/publications/detail/descripteurs-de-passeport-multi-cultures-faobioversity-v21/
- CropTrust’s Genesys: Descriptor lists (genesys-pgr.org)
- The Czech genebank: https://grinczech.vurv.cz/gringlobal/search.aspx
Metode
Vi vet ennå ikke hvor detaljert vi trenger å bygge egenskapssystemet for at det skal tjene formålet med Culton-sjekklisten. Den viktigste informasjonen om dyrking, lagring og bruk (såtemperatur, jordtypepreferanse, lys/mørke ifm spiring, høstemetode, lagringsmetode osv.) er åpenbart nødvendig. Men det er så mange datapunkter man kan måle at det kan være ganske overveldende. Mange av systemene vi ser på er utviklet for forsknings- og avlsformål, så det vil være nødvendig å trekke ut de viktigste egenskapene.
Det strukturelle målet er å lage én enkelt liste over egenskaper (med vedvarende UUID-er) og deretter en måte for systemet å bruke bare de relevante egenskapene for hver organisme eller gruppe av organismer når disse beskrives. For eksempel er egenskapene som beskriver fruktfarge eller potetsykdommer ikke relevans for gulrøtter, mens rotform, rotfarge og gulrotsykdommer har det. Det er ingen vits i et system som på en måte forventer irrelevante data.
Det er åpenbart noen egenskaper som er relevante for alle organismer, som opprinnelse, habitat osv. Disse kan lagres i hovedsymbiotabellen hvor alle avlinger/husdyr/mikroorganismer lagres.
De «symbioavhengige» egenskapene lagres bedre i separate tabeller slik at disse kan bygges uten denne forventningen om irrelevante data, og tabellene kan dermed bygges mindre og lettere vedlikeholdes. Dataene i disse tabellene vil være de faktiske diskriptordataene for kultivarer, for eksempel fruktfarge, modningstid, lagringsevne osv. for epler.
Metoden vår vil i utgangspunktet se slik ut:
- lag den første versjonen av kjerne-egenskapene som skal lagres direkte i tabellen for avlinger/husdyr/mikroorganismer (symbiotabellen som vi kaller den teknisk sett)
- fyll den listen med tilgjengelige data for de avlinger/husdyr/mikroorganismer vi har identifisert
- begynn å bygge separate egenskapslister for avlinger/husdyr/mikroorganismer basert på en sammenligning av deskriptorsystemene vi har funnet, og behold referansene til disse i tabellene
- for alle egenskaper vi dermed inkorporerer i systemet, vil den totale listen over egenskaper vokse, hver gitt sin unike ID (UUID)
- når systemet blir offentliggjort, vil vi kunne invitere brukerne til å bidra med data og faktisk håndtere disse dataene på en strukturert måte, siden rammeverket er klart
Data
Vår første betaversjon av sjekklistetjenesten vil kjøre fra beta.culton.org. Her på culton.org er det utviklingsdatasett, for det meste i regnearkformat, kun for intern diskusjon og tilgang begrenset til påloggede deltakere i prosjektet. Dersom det er lagt ut slike data, lenkes det dit under her:
Sist oppdatert 2023-09-02 av Karl Aakerro