Import danych

Origin został wyposażony w szereg mechanizmów wspomagających import danych. Dla szeregu typowych formatów danych zostały przygotowane procedury ich importu, a możliwość definiowania filtrów importu, pozwala wczytywać dane w dowolnym układzie w formacie ASCII. Przygotowany filtr dla określonego formatu pliku ASCII może być zapamiętany celem jego wielokrotnego użycia.

Standardowe formaty importu
Procedura importu dostępna w pozycji File menu głównego zawiera bardzo obszerny wykaz formatów plików, które są standardem w wymianie informacji lub są formatami zapisywanymi przez urządzenia laboratoryjne lub programy analizy danych.

Na rysunku obok pokazana została pełna zawartość opcji File + Import. Pozycja pierwsza Import Wizard pozwala wywołać procedurę definiowania filtru importu. Pozycje Single ASCII oraz Multiple ASCII pozwalają importować pojedynczy plik w formacie ASCII lub całą grupę plików. Dalsze pozycje na tej liście zawierają typowe formaty plików, do których importu program jest przystosowany i których import nie wymaga definiowania filtrów. Są wsród nich formaty typowe dla urządzeń laboratoryjnych lub stosowane przez inne programy do analizy i wizualizacji danych takie jak IgorPro, SigmaPlot, KaldeidaGraph, Matlab czy Minitab.

Jeśli użytkownik dysponuje plikiem ASCII o nietypowym formacie i procedury importu Single ASCII oraz Multiple ASCII nie dają pożądanego efektu, to do dyspozycji użytkownika pozostają procedury definiowania filtru importu.


Program rozpoznaje typowe struktury plików ASCII, które na ogół wyposażone są w nagłówek pliku, wiersz opisu kolumn danych oraz wiersz jednostek, po których następują wiersze danych ułożonych w kolumnach, separowanych określonym znakiem lub o stałej szerokości.




Rysunek powyżej pokazuje kilka początkowych wierszy pliku ASCII. Plik ten zawiera sześć wierszy nagłówkowych, pusty wiersz separacji, wiersz nagłówkowy z opisem kolumn oraz wiersz jednostek fizycznych wielkości w poszczególnych kolumnach. Po tym zestawie następują wiersze danych. Struktura tego typu może być zaimportowana automatycznie, bez koniczności definiowania nowego filtru, gdyż jest typową strukturą rozpoznawaną przez procdurę importu plików formatu ASCII. Jednak na jego przykładzie zostaną zademonstrowane możliwości w zakresie definiowania filtru importu.

Definiowanie filtrów importu
Kreator filtru importu wyświetla szereg następujących po sobie okien, które definiują poszczególne aspekty pracy filtru. W każdej chwili można wrócić do poprzednich okien, aby dokonać korekt. W każdej chwili można też zakończyć proces definiowania filtru i uruchomić go kliknięciem na przycisk .

Krok 1
W pierwszym kroku określany jest plik danych wejściowych. Po jego wyborze w sekcji Data Source program może podpowiedzieć filtr importu, jeśli był on do tej struktury pliku zdefiniowany wcześniej. Zaproponowany filtr wyświetlany jest w polu w sekcji Import Filter.
Krok 2
Krok drugi to etap definiowania reguł tworzenia nazw skoroszytów i arkuszy, które zostaną utworzone jako efekt pracy filtru. Dane po uruchomieniu importu będą zapisane w arkuszach o zdefiniowanych w tym kroku nazwach.
Krok 3
W kroku trzecim definiowana jest struktura nagłówka pliku ASCII. Można zdefiniować gdzie w nagłówku pliku znajdują się dane, które będą umieszczone w wierszach nagłówkowych arkusza, które dane zostaną zapisane w wierszu Long Name i Units oraz czy mają być wypełniane inne wiersze nagłówkowe. Nagłówek pliku ASCII dzielony jest na dwie części nazywane Header i Subheader Analiza w tej części dotyczy linii Subheader, która zawiera opis kolumn danych i ewentualnie wiersz jednostek. Główna część nagłówkowa może być analizowana w następnych krokach, co pozwala pobrać określone zmienne z nagłówka i umieści je jako dodatkowe parametry w arkuszu. Analiza w tym kroku dotyczy tylko wierszy wyświetlonych w tym przypadku w kolorze niebieskim i zielonym, bo one są kwalifikowane jako Subheader.
Krok 4
Krok czwarty pozwala zdecydować czy z nagłówka właściwego będą pobierane jakieś dane i jaka będzie ich lokalizacja w arkuszu po dokonaniu importu pliku. Jeśli wybrana zostanie jedna z opcji ekstrakcji zmiennych z nagłówka pliku ASCII, to w kroku następnym uruchamiana jest procedura definiowana położenia tych zmiennych w nagłówku. Krok następny jest pomijany, jeżeli nie zostanie zaznaczona żadna opcja ekstrakcji danych z nagłówka.
Krok 5
To okno jest wyświetlane jeśli w kroku poprzednim wybrano jedną z opcji ekstrakcji zmiennych z nagłówka pliku ASCII. W tym przypadku wybrana została opcja ekstrakcji na podstawie położenia zmiennej w nagłówku, definiowana numerem linii nagłówka i położeniem w linii liczonej liczbą znaków od jej początku. Moduł pozwala określić położenie zmiennej oraz nadać jej nazwę, pod którą będzie rozpoznawana po dokonaniu importu. Na pokazanym rysunku zdefiniowano dwie zmienne o nazwach Data i Godzina.
Krok 6
Krok szósty to definiowanie struktury właściwej sekcji danych. Należy określić przede wszystkim sposób separowania kolumn danych (Column Separator), typy poszczególnych kolumn (Column Destination) oraz format danych mających wymiar daty oraz separator części ułakowej w zapisie liczb dziesiętnych. W trakcie modyfikacji tych parametrów w dolnej sekcji wyświetlany jest podgląd, jak przy danych nastawach program "rozumie" plik danych.
Krok 7
Jeśli w kroku tym nie zostanie zaznaczone pole Save Filter, to dokonany zostanie jednorazowy import danych. Po zaznaczeniu tego pola zdefiniowany filtr zostanie zapamiętany na wybranej ścieżce i pod wybraną nazwą, celem ponownego jego wykorzystania w przyszłości. Po wyborze opcji z zapisem pliku aktywne staje się pole Specify Advanced Filter Options, po zaznaczeniu którego pojawi się jeszcze jedno okno definicji filtru opisane poniżej. Jeśli pole to nie zostanie zaznaczone, to okno w tym kroku jest ostatnim oknem definiowania filtru importu.


Uwaga!
Dla nowotworzonej na etapie importu kolumny E nie został zaktualizowany wiersz nagłówkowy Sparklines dlatego na powyższych rysunkach, komórka w tym wierszu i kolumnie E jest pusta. Wiersz Sparklines jest wygodnym podglądem charakteru zmienności serii danych w kolumnie.

Efekt importu i pracy końcowego skryptu w języku pokazuje rysunek powyżej po lewej stronie. Rysunek z prawej strony wyświetla arkusz wyjściowy w trybie Show Organizer, który pokazuje wszelkie dane ukryte związane z arkuszem. Zawarte tam są jak pokazano na rysunku zmienne Data i Godzina utoworzone poprzez ekstrakcje zmiennych z nagłówka pliku ASCII na etapie jego importu. Zmienne te mogą być wykorzystane w procedurach analizy i wizualizacji danych.

Poszczególne kroki definiowania procedury importu dają bardzo duże możliwości w zakresie budowy struktury filtru. Pozwalają stworzyć filtr, który pozwoli zaimportować każdą strukturę pliku ASCII, gromadzącego dane w układzie kolumnowym.