В класс локализации встроена поддержка операций сравнения символов в заданной локализации путем перегрузки оператора operator<
. При вызове любой стандартной функции, принимающей функтор сравнения, можно использовать в качестве такого функтора экземпляр класса локализации. (См. пример 13.8.)
#include
#include
#include
#include
#include
using namespace std;
bool localelessThan(const string& s1, const string& s2) {
const collate
use_facet
// локализацию
const char* pb1 = s1.data();
const char* pb2 = s2.data();
return (col.compare(pb1, pb1 + s1.size(),
pb2, pb2 + s2.size()) < 0);
}
int main() (
// Создать две строки, одна с немецким символом
string s1 = "diät";
string s2 = "dich";
vector
v.push_back(s1);
v.push_back(s2);
// Сортировать, не используя заданную локализацию, т.е. Применяя
// правила текущей глобальной локализации
sort(v.begin(), v.end());
for (vector
p != v.end(); ++p)
cout << *p << endl;
// Установить в качестве глобальной немецкую локализацию и затем
// сортировать
locale::global(locale("german"));
sort(v.begin(), v.end(), localelessThan);
for (vector
p != v.end(); ++p)
cout << *p << endl;
}
Первый вариант обеспечивает сортировку по коду ASCII, и поэтому результат будет выглядеть следующим образом.
dich
diät
Вторая сортировка использует правильный порядок букв немецкого алфавита, и поэтому результат будет противоположным.
diät
dich
Сортировка усложняется, когда вы работаете с различными локализациями, но стандартная библиотека решает эту проблему. Фасет collate
обеспечивает функцию-член compare
, которая работает как strcmp
: она возвращает значение -1, если первая строка меньше второй, значение 0, если они равны, и значение 1, если первая строка больше второй. В отличие от strcmp
, функция collate::compare
использует определенную в целевой локализации упорядоченность символов.
В примере 13.8 приводится функция localeLessThan
, которая возвращает True
, если согласно глобальной локализации первый аргумент меньше второго. Самым важным здесь моментом является вызов функции сравнения.
col.compare(pb1, // Указатель на первый символ
pb1 + s1.size(), // Указатель на позицию за последним символом
pb2,
pb2 + s2.size());
Выполнение примера 13.8 на вашем компьютере может дать результат как совпадающий, так и не совпадающий с приведенным мною, — это зависит от используемого в вашей реализации набора символов. Однако, если требуется обеспечить сравнение строк с учетом местных особенностей, вам следует использовать collate::compare
. Конечно, стандарт не требует, чтобы реализация поддерживала какую-либо локализацию, кроме локализации «C», поэтому не забудьте протестировать все используемые вами локализации.
Глава 14
XML
14.0. Введение
Язык XML играет важную роль во многих областях, в том числе при хранении и поиске информации, в издательском деле и при передаче данных по сетям; в данной главе мы научимся работать с XML в С++. Поскольку эта книга больше посвящена С++, чем XML, я полагаю, вы уже имеете некоторый опыт применения различных технологий, связанных с XML, например SAX, DOM, XML Schema, XPath и XSLT. He стоит беспокоиться из-за того, что вы не являетесь экспертом во всех этих областях; приводимые в данной главе рецепты достаточно независимы друг от друга, поэтому вы можете пропустить некоторые из них и все-таки понять остальные. Во всяком случае, каждый рецепт дает краткое описание концепций XML и используемого ими инструментария.