Zadanie
Program czyta dwa napisy, sprawdzający czy są anagramami (to znaczy występują w nich dokładnie te same litery) i wyświetla o tym informację.
Algorytm
Jak zwykle można problem rozwiązać na wiele sposobów.
Policzyć wystąpienia wszystkich liter w jednym napisie i porównać z wystąpieniami w drugim. (Jeżeli w pierwszym napisie litera a wystąpi dwa razy i litera b trzy razy, a w drugim a trzy razy a b dwa razy — napisy nie mogą być anagramami!).
Przeglądać kolejne litery w napisie pierwszym i „odznaczać" w drugim. Jeżeli jakaś litera jest w napisie pierwszym, a nie ma w drugim — wyrazy nie są anagramami. Jeżeli po przejrzeniu całego pierwszego napisu zostaną jakieś nieodznaczone litery w drugim — napisy nie są anagramami.
Napisy o różnej długości nie mogą być anagramami.
…
Długość napisu
Funkcja strlen
podaje długość napisu:
#include <string.h>
...
size_t strlen(const char *s);
(Uwaga, typ size_t
to (najprawdopodobniej) unsigned long int
.)
Użycie:
printf ( "Dlugosc napisu \"Ala ma kota\", to %d\n", (int) strlen("Ala ma kota") );
char * tekst[100];
scanf("%s", tekst);
printf( "Dlugosc wczytanego tekstu to: %d\n", (int) strlen(tekst) );
(Ten (int)
przed wywołaniem funkcji strlen
jest po to, aby móc wydrukować wartość size_t
używając specyfikacji %d
.)
Wielkie/małe litery
Funkcje tolower
i toupper
dokonują konwersji z wielkich do małych (i odwrotnie). Jeżeli litera jest już „mała" („wielka") nie ulega zmianie.
#include <ctype.h>
...
int toupper(int c);
int tolower(int c);
...
char a = tolower('A');
Konwersja dokonywana jest na pojedynczej literze!
Funkcje islower
i isupper
odpowiadają na pytanie czy litera jest mała/wielka. Gdy prawda — zwracają wartość różną od zera.
#include <ctype.h>
...
int islower(int c);
int isupper(int c);
Funkcje testują pojedynczy znak!
Założenia
Po pierwsze należy rozstrzygnąć czy program będzie case sensitive (czyli czy będzie rozróżniał wielkie i małe litery).
Po drugie należy podjąć decyzję, czy program będzie uwzględniał odstępy czy nie. Można rozważyć funkcję, której jednym z parametrów będzie informacja, czy ma uwzględniać odstępy.
Zakładamy, że oba napisy będą dostarczane przez użytkownika.
Funkcja
scanf()
nie pozwala (łatwo) wczytać napisu z odstępami.Rozstrzygnąć trzeba czy program wprowadza ograniczenia na długość sprawdzanego tekstu.
Ani funkcja
scanf()
ani1 nie zwracają uwagi na długość dostarczonego z klawiatury tekstu; nie sprawdzają czy nie przekracza on długości tablicy, do której tekst ma być wczytany. Funkcjagets()
scanf()
standardowo czyta do pierwszego odstępu co (ale tylko nieco) zmniejsza prawdopodobieństwo przepełnienia bufora.Funkcja
fgets()
pozwala ograniczyć liczbę czytanych znaków2.
Użycie funkcji fgets
Prototyp funkcji fgets()
wygląda następująco:
char *fgets(char *s, int size, FILE *stream);
pierwszy argument funkcji to adres bufora (tablicy znakowj) do którego wpisany zostanie przeczytany z tablicy tekst,
drugi argument to długość bufora (w znakach),
trzeci argument to opis (adres struktury danych opisujących) strumienia wejściowego, z którego czytamy; w przypadku standardowego strumienia wejściowego —
stdin
.
Funkcja fgets
czyta tekst ze strumienia. Znak nowej linii zastępowany jest znakiem o kodzie ASCII 0 (koniec tekstu); jeżeli znaków jest więcej niż „długość bufora" czytanych jest tylko tyle znaków, żeby nie przepełnić bufora, a na końcu dodawany jest znak o kodzie ASCII 0.
Algorytm odczytu napisu
Przedstawiam poniżej alternatywny sposób czytania tekstów z terminala. Może on również być wykorzystany (po drobnych modyfikacjach) do czytania danych innego typu o nieznanej długości.
Najpierw przydzielana jest początkowa pamięć do bufora danych (linia 20).
Algorytm czyta kolejne znaki ze standardowego wejścia używając funkcji
getchar()
(linia 38). Funkcja ta zwraca kod ASCII przeczytanego znaku lub specjalny kodEOF
gdy wystąpi błąd lub system powie, że strumień wejściowy jest już zamknięty3.Każdy odczytany znak wstawiany jest do bufora (linia 38).
Gdy bufor się wypełni (linia 46) — jego wielkość powiększana jest o kolejny kwant (linia 48).
Gdy odczytany znak ma kod
'\n'
(znak przejścia do nowej linii) lubEOF
(koniec danych) (linia 39) w buforze zastępowany jest znakiem o kodzie ASCII 0 (koniec tekstu), a nadmiarowa pamięć jest zwalniana (linia 42).
|
|
Funkcja zwraca adres początku bufora.